o1满血版泄露!奥数题图片推理手拿把掐 奥特曼剧透o2

o1满血版泄露了!

没想到,OpenAI还搁那儿今年一定呢,不少网友已经率先上手体验到了(doge)。

事情是酱婶的:有网友发现,OpenAI已经在ChatGPT官网上部署了完整版o1,大家伙儿还都能卡bug直接用!

o1满血版泄露!奥数题图片推理手拿把掐 奥特曼剧透o2

最初发现此事的网友,测试确认泄露模型具有奥特曼所说的图像推理能力。

o1满血版泄露!奥数题图片推理手拿把掐 奥特曼剧透o2
△图源:@legit_rumors

而日志也显示该模型就是o1本模。

o1满血版泄露!奥数题图片推理手拿把掐 奥特曼剧透o2

于是,赶在OpenAI出手修复之前,网友们抓紧大玩特玩了一波——

满血o1到底有多牛

和已经发布的o1-preview、o1-mini最直观的不同是,泄露出来的o1支持上传附件。

这也就意味着,终于能测测o1的多模态能力了。

网友们也不说废话,直接上强度,普特南数学竞赛的证明题截图一贴,甩给满血o1。

对正整数n,有fn(x)=cos(x)cos(2x)cos(3x)…cos(nx)。找出最小的n,使得|fn‘’(0)|>2023。

o1满血版泄露!奥数题图片推理手拿把掐 奥特曼剧透o2

思考了18秒之后,o1给出答案:18。

o1满血版泄露!奥数题图片推理手拿把掐 奥特曼剧透o2

答案正确:

o1满血版泄露!奥数题图片推理手拿把掐 奥特曼剧透o2

再来一道更复杂的,虽然在识图上遇到了一点小问题,但还是稳稳做对了。

o1满血版泄露!奥数题图片推理手拿把掐 奥特曼剧透o2

o1满血版泄露!奥数题图片推理手拿把掐 奥特曼剧透o2

在如此惊艳表现之下,似乎正确识别人类史上首张黑洞照片也不算什么了(doge)。

o1满血版泄露!奥数题图片推理手拿把掐 奥特曼剧透o2

不过嘛,也不是没有翻车案例。比如,让大模型数数图里有多少个三角形。

o1满血版泄露!奥数题图片推理手拿把掐 奥特曼剧透o2

ID为anagh的网友,给泄露模型和GPT-4o做了个同屏对比:4o速度很快,给出了错误答案19。

而满血o1花了1分39秒,狂刷一堆token……给出了不同的错误答案:29。

正确答案是24。

o1满血版泄露!奥数题图片推理手拿把掐 奥特曼剧透o2

这个bug现在已经修复了。不过,有意思的是,这次模型泄露,持续了整整3个小时。

不小心还是故意的?

有网友犀利地点出,这事儿看上去不是不小心,而是精心策划:

目的是让人们对即将发布的模型有一个预期。

o1满血版泄露!奥数题图片推理手拿把掐 奥特曼剧透o2

不少网友赞同这样的观点:

奥特曼的目的是测试和炒作。

o1满血版泄露!奥数题图片推理手拿把掐 奥特曼剧透o2

而由于一切看上去已经部署就绪,甚至有人猜测,o1完整版的正式上线时间就在未来一周之内。

o1满血版泄露!奥数题图片推理手拿把掐 奥特曼剧透o2

值得注意的是,就在这次泄露事件之后,奥特曼马上在??上开始了自己的表演:

o1满血版泄露!奥数题图片推理手拿把掐 奥特曼剧透o2

好家伙,都已经吹上o2的风了(还假装上错号……)。

o1满血版泄露!奥数题图片推理手拿把掐 奥特曼剧透o2

至于为什么是这个时间……

那不得赶在Anthropic发布Claude Haiku 3.5之前搞点事嘛(doge)。

o1满血版泄露!奥数题图片推理手拿把掐 奥特曼剧透o2

参考链接:

[1]https://x.com/legit_rumors/status/1852625385801859321

[2]https://x.com/koltregaskes/status/1852657291469709626

[3]https://x.com/anaghnairr/status/1852668741751919016

主题测试文章,只做测试使用。发布者:sengcheng,转转请注明出处:https://www.sengcheng.com/6798.html

(0)
sengcheng的头像sengcheng
上一篇 2024年11月4日 上午11:13
下一篇 2024年11月4日 上午11:13

相关推荐

  • 任正非:英语是华为工作语言 除我之外员工都说得很好

    11月1日消息,据媒体报道,在ICPC(国际大学生程序设计竞赛)上,华为CEO任正非与ICPC主席、教练及获奖选手举办座谈会。 任正非在会上被问到:华为在全球有很多研究中心,而且他们说不同的语言,您认为语言是否是一个障碍,会导致华为不同地方的人没有办法高效地沟通或分享信息?华为是怎么解决这种语言障碍的? 对此,任正非表示,员工们喝咖啡的时候可能用的是本地语言…

    2024年11月1日
    2900
  • i3默秒全再见!亚马逊上最畅销的10款CPU:全是AMD Intel被清除

    11月17日消息,随着锐龙系列处理器大获成功,尤其是X3D系列在游戏市场的统治级优势,曾经的i3默秒全一去不复返了。 wccftech日前列举了亚马逊上最畅销的10款CPU,结果全是AMD,一款Intel也没有了。 从畅销榜来看,X3D系列的两款当红炸子鸡——锐龙7 9800X3D、锐龙7 7800X3D位列头名和次席。 前不久,德国…

    2024年11月17日
    2000
  • 清华AI医院上线!42位AI医生 能看300多种病

    张亚勤旗下,清华AIR又一孵化项目曝光: 紫荆智康,专注AI医疗。 他们构建了Agent Hospital(也被称为清华AI医院),首批AI医生现已亮相内测! 今年5月,由清华大学智能产业研究院(AIR)智慧医疗团队完成的论文Agent Hospital: A Simulacrum of Hospital with Evolvable Medical Age…

    2024年11月20日
    2700
  • Redmi K80系列配置、售价大曝光!卢伟冰:强得让王腾有点飘

    11月8日消息,小米15发布之后,Redmi K80系列也要来了。 昨晚,小米中国区市场部副总经理、Redmi品牌总经理王腾昨晚通过直播透露了新机的多个重要变化,直言K80比13更强,配置大于13,且价格低于13。从竞品来看,这里的13大概率就是刚刚发布的一加13和iQOO 13了。 小米集团合伙人、总裁,手机部总裁,小米品牌总经理卢伟冰也直言:K80太强了…

    2024年11月8日
    3100
  • 绵羊毛+桑蚕丝 A股上市品牌芬腾秋衣套装冲量:券后39元

    芬腾 羊毛蚕丝秋衣套装日常售价 79.9 元,今日下单可领 30 元优惠券,叠加立减10元,到手价 39.9 元。 购买链接:天猫(券后39.9元) 含绵羊毛 + 桑蚕丝,双面磨绒,厚度恰到好处。 无痕款 3D 随心裁剪,自由自在不紧勒。 有无痕和包边两款可选,共 11 种颜色。 购买提醒: 天猫芬腾雷霆专卖店商品,正品保障,支持七天无理由退换,请查看最新评…

    2024年11月13日
    2500

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信