OpenAI CEO罕见认错:DeepSeek是非常好的模型 将考虑跟进开源!

北京时间2月1日凌晨,为应对DeepSeek-R1所带来的竞争,OpenAI正式发布了o3-mini模型,这也是OpenAI推理系列中最新、最具成本效益的模型,并且已在ChatGPT和API中开放使用。

据悉,该模型在数学代码等基准测试中刷新SOTA,相关测试中o3-mini(high)在准确率和校准误差(Calibration Error)均是最优。

OpenAI CEO罕见认错:DeepSeek是非常好的模型 将考虑跟进开源!
△o3-mini与o1在AIME竞赛数学的得分对比

据介绍,o3-mini的价格比OpenAI o1-mini便宜63%,比满血版o1便宜93%。开发者可根据需求选择高、中、低三种推理强度,让o3-mini在处理复杂问题时进行深度思考,平衡速度和准确性。

具体来说,目前ChatGPT免费用户首次可以体验一个有限速率的o3-mini版本,速率限制与现有的 GPT-4o 限制类似;Plus用户可选择o3-mini-high更高智能版本;每月支付200美元的 Pro 用户可无限使用o3-mini和o3-mini-high。

API层面,o3-mini输入1.10美元/百万token、输出4.40美元/百万token,价格比o1-mini便宜63%,比满血版o1便宜93%,但仍是GPT-4o mini的7倍左右。

OpenAI表示,o3-mini的发布是在追求高效能智能技术道路上的又一重要里程碑。通过优化科学(Science)、技术(Technology)、工程(Engineering)和数学(Mathematics)领域的推理能力,同时保持较低的成本,让高质量AI技术变得更加平易近人。

OpenAI联合创始人、首席执行官山姆奥尔特曼在o3-mini发布后的在线问答中透露:在未来几周,满血版o3即将上线。

谈及对于DeepSeek的看法,奥尔特曼表示:它(DeepSeek)确实是一个非常好的模型,OpenAI会开发出更好的模型,但我们不会像往年那样保持那么大的领先优势了。

奥尔特曼还罕见地承认了自己的错误,并表示OpenAI正在讨论一个新的开源策略。

我个人认为,在这个问题上我们站错了队,需要想出一个不同的开源策略;不是OpenAI的每个人都持有这种观点,而且这也不是我们目前的最高优先级。

OpenAI CEO罕见认错:DeepSeek是非常好的模型 将考虑跟进开源!

OpenAI CEO罕见认错:DeepSeek是非常好的模型 将考虑跟进开源!

值得一提的是,图灵奖得主、主导Meta AI研究的首席科学家Yann LeCun日前就曾指出,DeepSeek 成功的最大收获,是AI开源的价值使任何人都能受益。

对那些看到DeepSeek表现并认为‘中国在AI领域正超越美国’的人而言,你的解读错了,正确解读应是‘开源模型正超越专有模型’。DeepSeek 从开放研究和开源获益良多(如同PyTorch和Llama),他们提出新想法,并从其他人的工作基础加以建构。他们发布新的模型并开源,所以每个人都能从中受益,这就是开放研究和开源的力量。Yann LeCun说道。

近期,中国AI技术厂商DeepSeek推出的V3和 R1 两款开源 AI 模型都颠覆了业界对于AI算力需求的看法。

特别是DeepSeek推出的推理大模型DeepSeek-R1,其不仅性能比肩OpenAI o1 ,并且其所需的训练成本可能只有后者的约1/20(仅用了2048 个 H800 GPU,花了两个月的时间训练完成,仅花费了约558万美元),API的定价更是只有后者的约1/28,相当于使用成本降低了约97%。

也就是说,DeepSeek采用并不先进的AI芯片,以更低的算力要求和更低的成本,达到了OpenAI等美国AI技术厂商的顶级AI大模型的效果。

这一成就被认为对美国的人工智能领导地位构成威胁,不仅引发了OpenAI、Meta、谷歌等众多大模型厂商恐慌,还引发了英伟达等AI芯片企业的价值重估和股价大跌。

然而,据SemiAnalysis,与外界认为DeepSeek公司拥有5万张H100 GPU计算卡看法不同,该机构认为,DeepSeek囤积了6万张英伟达GPU卡,其中包括1万张A100、1万张H100、1万张特供版H800、3万张特供版H20,算力资本支出的总体拥有成本(TCO)超过140亿元,达19.96亿美元(约合人民币143.45亿元)。

DeepSeek 的总服务器资本支出约为 16.29 亿美元,运营此类集群的成本高达 9.44 亿美元,因此总体的成本可能高达 25.73 亿美元。

OpenAI CEO罕见认错:DeepSeek是非常好的模型 将考虑跟进开源!

但是,DeepSeek并未进行过大规模融资,其母公司幻方似乎也不太可能会进行如此大规模的硬件支出。

DeepSeek官方公布的数据来看,其DeepSeek-V3的训练仅用了约2080张英伟达H800加速卡,这部分的芯片投资大约为4000万美元左右。

而且,DeepSeek训练其AI模型也并不一定非要拥有庞大的自有的硬件基础设施,其完全可以通过租用第三方的硬件基础设施来对自己的大模型进行训练。

不过,如果SemiAnalysis对于DeepSeek囤积了6万张英伟达GPU加速卡的分析是正确的话,那么这也意味着DeepSeek现有的AI算力硬件,足以支撑其沿着目前的技术路径在未来持续研发出多代性能更为强大的AI大模型。

主题测试文章,只做测试使用。发布者:火星财经,转转请注明出处:https://www.sengcheng.com/article/18536.html

(0)
火星财经的头像火星财经
上一篇 2025年2月3日 下午3:00
下一篇 2025年2月3日 下午3:00

相关推荐

  • iPhone卖不动了!郭明錤称Apple智能效果不显著

    2月1日消息,天风证券分析师郭明錤在2月1日发布简报指出,Apple智能(Apple Intelligence)对iPhone销量的提振作用有限。 通过对比美国和日本市场数据,郭明錤发现,尽管美国市场提供了Apple智能功能,但iPhone出货量并未显著增长。 相反,未提供该功能的日本市场在2024年第四季度的iPhone出货量却实现了高个位数的同比增长。 …

    2025年2月1日
    2500
  • 《黑神话:悟空》海外销量占比约30%:已经超出预期!

    《黑神话:悟空》自上线以来就收获极大的成功,根据数据统计网站Gamalytic的数据显示,目前本作的预测销量已经来到了9.675亿美元,约为人民币70.156亿元! 日前,《黑神话:悟空》美术总监杨奇参加了一场在中国美术学院动画与游戏学院举行的座谈会,动画与游戏学院副院长宣学君向他提问:《黑神话:悟空》的海外玩家占多少比例?你怎么看待数字场景下的东方视觉表达…

    2025年2月23日
    1700
  • 国产科幻大片《流浪地球3》下月开机:网友喊话求加入我国6代战机

    2月5日消息,据国内媒体报道称,国产科幻大片《流浪地球3》将会在下月开机,预计2027年春节上映(此前官方已经宣布2027年大年初一上映)。 根据此前根据国家电影局最新备案公示显示,国产科幻大片《流浪地球3》(上)与《流浪地球3》(下)备案立项。 据现在有爆料表示《流浪地球3》今年三月份开机,现在在筹备,刘德华年中进组,而且是上下部连拍,拍摄周期八个月,年底…

    2025年2月5日
    2600
  • 小米汽车公布3月购车权益!依旧赠送Nappa真皮座椅、智驾增强功能

    3月2日消息,近日,小米汽车公布了小米SU7车型在3月的购车权益。 2025年3月1日至31日期间,用户下定小米SU7全系车型,可享受以下权益:赠送价值8000元的Nappa真皮座椅以及小米智能驾驶功能终身免费使用权。 最新的销量显示,2025年2月,小米SU7交付量突破2万辆,已连续5个月交付量超2万辆,累计交付量超过18万辆。 此外,2月27日上市的小米…

    2025年3月2日
    1700
  • 哈弗史上最大SUV!2025款H5官图发布:全车黑化、整体加高

    3月9日消息,长城汽车发布了2025款哈弗H5官图。 新车定位大型全用途硬派SUV,新款车型全车采用了黑化设计,整体造型硬朗。 此外,车身高度也有所增加,作为参考,长宽高分别为5190×1905×1835mm,轴距达3140mm。 外观上,前脸配备硕大的梯形进气格栅,搭配粗壮的镀铬饰条和大面积大灯组,车身线条硬朗,尾部采用竖条状尾灯和…

    2025年3月9日
    1200

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信