OpenAI CEO罕见认错:DeepSeek是非常好的模型 将考虑跟进开源!

北京时间2月1日凌晨,为应对DeepSeek-R1所带来的竞争,OpenAI正式发布了o3-mini模型,这也是OpenAI推理系列中最新、最具成本效益的模型,并且已在ChatGPT和API中开放使用。

据悉,该模型在数学代码等基准测试中刷新SOTA,相关测试中o3-mini(high)在准确率和校准误差(Calibration Error)均是最优。

OpenAI CEO罕见认错:DeepSeek是非常好的模型 将考虑跟进开源!
△o3-mini与o1在AIME竞赛数学的得分对比

据介绍,o3-mini的价格比OpenAI o1-mini便宜63%,比满血版o1便宜93%。开发者可根据需求选择高、中、低三种推理强度,让o3-mini在处理复杂问题时进行深度思考,平衡速度和准确性。

具体来说,目前ChatGPT免费用户首次可以体验一个有限速率的o3-mini版本,速率限制与现有的 GPT-4o 限制类似;Plus用户可选择o3-mini-high更高智能版本;每月支付200美元的 Pro 用户可无限使用o3-mini和o3-mini-high。

API层面,o3-mini输入1.10美元/百万token、输出4.40美元/百万token,价格比o1-mini便宜63%,比满血版o1便宜93%,但仍是GPT-4o mini的7倍左右。

OpenAI表示,o3-mini的发布是在追求高效能智能技术道路上的又一重要里程碑。通过优化科学(Science)、技术(Technology)、工程(Engineering)和数学(Mathematics)领域的推理能力,同时保持较低的成本,让高质量AI技术变得更加平易近人。

OpenAI联合创始人、首席执行官山姆奥尔特曼在o3-mini发布后的在线问答中透露:在未来几周,满血版o3即将上线。

谈及对于DeepSeek的看法,奥尔特曼表示:它(DeepSeek)确实是一个非常好的模型,OpenAI会开发出更好的模型,但我们不会像往年那样保持那么大的领先优势了。

奥尔特曼还罕见地承认了自己的错误,并表示OpenAI正在讨论一个新的开源策略。

我个人认为,在这个问题上我们站错了队,需要想出一个不同的开源策略;不是OpenAI的每个人都持有这种观点,而且这也不是我们目前的最高优先级。

OpenAI CEO罕见认错:DeepSeek是非常好的模型 将考虑跟进开源!

OpenAI CEO罕见认错:DeepSeek是非常好的模型 将考虑跟进开源!

值得一提的是,图灵奖得主、主导Meta AI研究的首席科学家Yann LeCun日前就曾指出,DeepSeek 成功的最大收获,是AI开源的价值使任何人都能受益。

对那些看到DeepSeek表现并认为‘中国在AI领域正超越美国’的人而言,你的解读错了,正确解读应是‘开源模型正超越专有模型’。DeepSeek 从开放研究和开源获益良多(如同PyTorch和Llama),他们提出新想法,并从其他人的工作基础加以建构。他们发布新的模型并开源,所以每个人都能从中受益,这就是开放研究和开源的力量。Yann LeCun说道。

近期,中国AI技术厂商DeepSeek推出的V3和 R1 两款开源 AI 模型都颠覆了业界对于AI算力需求的看法。

特别是DeepSeek推出的推理大模型DeepSeek-R1,其不仅性能比肩OpenAI o1 ,并且其所需的训练成本可能只有后者的约1/20(仅用了2048 个 H800 GPU,花了两个月的时间训练完成,仅花费了约558万美元),API的定价更是只有后者的约1/28,相当于使用成本降低了约97%。

也就是说,DeepSeek采用并不先进的AI芯片,以更低的算力要求和更低的成本,达到了OpenAI等美国AI技术厂商的顶级AI大模型的效果。

这一成就被认为对美国的人工智能领导地位构成威胁,不仅引发了OpenAI、Meta、谷歌等众多大模型厂商恐慌,还引发了英伟达等AI芯片企业的价值重估和股价大跌。

然而,据SemiAnalysis,与外界认为DeepSeek公司拥有5万张H100 GPU计算卡看法不同,该机构认为,DeepSeek囤积了6万张英伟达GPU卡,其中包括1万张A100、1万张H100、1万张特供版H800、3万张特供版H20,算力资本支出的总体拥有成本(TCO)超过140亿元,达19.96亿美元(约合人民币143.45亿元)。

DeepSeek 的总服务器资本支出约为 16.29 亿美元,运营此类集群的成本高达 9.44 亿美元,因此总体的成本可能高达 25.73 亿美元。

OpenAI CEO罕见认错:DeepSeek是非常好的模型 将考虑跟进开源!

但是,DeepSeek并未进行过大规模融资,其母公司幻方似乎也不太可能会进行如此大规模的硬件支出。

DeepSeek官方公布的数据来看,其DeepSeek-V3的训练仅用了约2080张英伟达H800加速卡,这部分的芯片投资大约为4000万美元左右。

而且,DeepSeek训练其AI模型也并不一定非要拥有庞大的自有的硬件基础设施,其完全可以通过租用第三方的硬件基础设施来对自己的大模型进行训练。

不过,如果SemiAnalysis对于DeepSeek囤积了6万张英伟达GPU加速卡的分析是正确的话,那么这也意味着DeepSeek现有的AI算力硬件,足以支撑其沿着目前的技术路径在未来持续研发出多代性能更为强大的AI大模型。

主题测试文章,只做测试使用。发布者:火星财经,转转请注明出处:https://www.sengcheng.com/article/18536.html

(0)
火星财经的头像火星财经
上一篇 2025年2月3日 下午3:00
下一篇 2025年2月3日 下午3:00

相关推荐

  • 新能源汽车遇到寒潮、雨雪怎么办!为了家人 一定要看

    1月23日中央气象台发布寒潮蓝色预警,这是今年来首个寒潮预警。这几天,寒潮天气过程持续影响我国,许多地方都出现了大幅降温、雨雪等天气。 最近正值春运高峰期,很多人会选择开车回家,对于新能源车,在长途出行之前需要准备什么?如果遇到雨雪等特殊天气,又该怎么办?这篇文章一次为大家说清~ 长途出行前新能源车要做好这些准备 1、检查车辆状态 在出行之前,首先要检查车辆…

    2025年1月27日
    1200
  • 叉腰、扎马步:看看我国1600多年前的“手电筒”

    2月3日消息,在浙江省博物馆,有一件瓯窑青瓷点彩牛形灯盏,20世纪50年代出土于浙江温州的一处东晋墓地,距今已有1600多年,属于国家一级文物。 这件牛形灯盏的造型非常特殊,前腿叉腰,后腿扎马步,呈拟人直立姿态,憨态可掬,仿佛一个表情包。 牛形灯盏口径18.9厘米、高13.4厘米,分为承盘、灯柱、把手三个部分。 其中,承盘用于存放灯油,灯柱可以插入灯芯,而弧…

    2025年2月3日
    200
  • 你买了吗!金价大涨创历史新高 国内足金首饰1克突破846元

    1月31日消息,据国内媒体报道称,截至1月31日10时,现货黄金最高涨至2799.86美元/盎司,刷新历史高位;COMEX黄金期货最高涨至2859.5美元/盎司,刷新历史高位。 在这样的大背景刺激下,31日,国内多家金店足金首饰价格已达846元/克。 2024年以来,黄金投资热度不减。日前披露的公募基金四季报显示,全部黄金商品型基金均在2024年实现规模大涨…

    2025年1月31日
    800
  • 流量逆转!DeepSeek美国访问量激增 ChatGPT明显下降

    2月3日消息,根据在线分析平台Semrush的数据,尽管ChatGPT仍然是全球最受欢迎的AI应用之一,但其流量正在下降,而新兴的DeepSeek正在迅速崛起。 数据显示,目前DeepSeek在消费者活动方面仍落后于ChatGPT,ChatGPT的平均每日访问量保持在数千万。 不过ChatGPT最近的流量有所下降,在2024年10月1日它有2210万访客,但…

    2025年2月3日
    200
  • 2024年我国软件业利润总额达16953亿元 同比增长8.7%

    1月27日消息,根据工信部数据,2024年我国软件和信息技术服务业运行态势良好,软件业务收入平稳增长,2024年,我国软件业务收入137276亿元,同比增长10.0%;利润总额为16953亿元,同比增长8.7%;软件业务出口为569.5亿美元,增长3.5%。 分领域看,软件产品收入稳健增长,达到30417亿元,增长6.6%,占全行业收入的22.2%。 其中,…

    2025年1月27日
    1200

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信