OpenAI CEO罕见认错:DeepSeek是非常好的模型 将考虑跟进开源!

北京时间2月1日凌晨,为应对DeepSeek-R1所带来的竞争,OpenAI正式发布了o3-mini模型,这也是OpenAI推理系列中最新、最具成本效益的模型,并且已在ChatGPT和API中开放使用。

据悉,该模型在数学代码等基准测试中刷新SOTA,相关测试中o3-mini(high)在准确率和校准误差(Calibration Error)均是最优。

OpenAI CEO罕见认错:DeepSeek是非常好的模型 将考虑跟进开源!
△o3-mini与o1在AIME竞赛数学的得分对比

据介绍,o3-mini的价格比OpenAI o1-mini便宜63%,比满血版o1便宜93%。开发者可根据需求选择高、中、低三种推理强度,让o3-mini在处理复杂问题时进行深度思考,平衡速度和准确性。

具体来说,目前ChatGPT免费用户首次可以体验一个有限速率的o3-mini版本,速率限制与现有的 GPT-4o 限制类似;Plus用户可选择o3-mini-high更高智能版本;每月支付200美元的 Pro 用户可无限使用o3-mini和o3-mini-high。

API层面,o3-mini输入1.10美元/百万token、输出4.40美元/百万token,价格比o1-mini便宜63%,比满血版o1便宜93%,但仍是GPT-4o mini的7倍左右。

OpenAI表示,o3-mini的发布是在追求高效能智能技术道路上的又一重要里程碑。通过优化科学(Science)、技术(Technology)、工程(Engineering)和数学(Mathematics)领域的推理能力,同时保持较低的成本,让高质量AI技术变得更加平易近人。

OpenAI联合创始人、首席执行官山姆奥尔特曼在o3-mini发布后的在线问答中透露:在未来几周,满血版o3即将上线。

谈及对于DeepSeek的看法,奥尔特曼表示:它(DeepSeek)确实是一个非常好的模型,OpenAI会开发出更好的模型,但我们不会像往年那样保持那么大的领先优势了。

奥尔特曼还罕见地承认了自己的错误,并表示OpenAI正在讨论一个新的开源策略。

我个人认为,在这个问题上我们站错了队,需要想出一个不同的开源策略;不是OpenAI的每个人都持有这种观点,而且这也不是我们目前的最高优先级。

OpenAI CEO罕见认错:DeepSeek是非常好的模型 将考虑跟进开源!

OpenAI CEO罕见认错:DeepSeek是非常好的模型 将考虑跟进开源!

值得一提的是,图灵奖得主、主导Meta AI研究的首席科学家Yann LeCun日前就曾指出,DeepSeek 成功的最大收获,是AI开源的价值使任何人都能受益。

对那些看到DeepSeek表现并认为‘中国在AI领域正超越美国’的人而言,你的解读错了,正确解读应是‘开源模型正超越专有模型’。DeepSeek 从开放研究和开源获益良多(如同PyTorch和Llama),他们提出新想法,并从其他人的工作基础加以建构。他们发布新的模型并开源,所以每个人都能从中受益,这就是开放研究和开源的力量。Yann LeCun说道。

近期,中国AI技术厂商DeepSeek推出的V3和 R1 两款开源 AI 模型都颠覆了业界对于AI算力需求的看法。

特别是DeepSeek推出的推理大模型DeepSeek-R1,其不仅性能比肩OpenAI o1 ,并且其所需的训练成本可能只有后者的约1/20(仅用了2048 个 H800 GPU,花了两个月的时间训练完成,仅花费了约558万美元),API的定价更是只有后者的约1/28,相当于使用成本降低了约97%。

也就是说,DeepSeek采用并不先进的AI芯片,以更低的算力要求和更低的成本,达到了OpenAI等美国AI技术厂商的顶级AI大模型的效果。

这一成就被认为对美国的人工智能领导地位构成威胁,不仅引发了OpenAI、Meta、谷歌等众多大模型厂商恐慌,还引发了英伟达等AI芯片企业的价值重估和股价大跌。

然而,据SemiAnalysis,与外界认为DeepSeek公司拥有5万张H100 GPU计算卡看法不同,该机构认为,DeepSeek囤积了6万张英伟达GPU卡,其中包括1万张A100、1万张H100、1万张特供版H800、3万张特供版H20,算力资本支出的总体拥有成本(TCO)超过140亿元,达19.96亿美元(约合人民币143.45亿元)。

DeepSeek 的总服务器资本支出约为 16.29 亿美元,运营此类集群的成本高达 9.44 亿美元,因此总体的成本可能高达 25.73 亿美元。

OpenAI CEO罕见认错:DeepSeek是非常好的模型 将考虑跟进开源!

但是,DeepSeek并未进行过大规模融资,其母公司幻方似乎也不太可能会进行如此大规模的硬件支出。

DeepSeek官方公布的数据来看,其DeepSeek-V3的训练仅用了约2080张英伟达H800加速卡,这部分的芯片投资大约为4000万美元左右。

而且,DeepSeek训练其AI模型也并不一定非要拥有庞大的自有的硬件基础设施,其完全可以通过租用第三方的硬件基础设施来对自己的大模型进行训练。

不过,如果SemiAnalysis对于DeepSeek囤积了6万张英伟达GPU加速卡的分析是正确的话,那么这也意味着DeepSeek现有的AI算力硬件,足以支撑其沿着目前的技术路径在未来持续研发出多代性能更为强大的AI大模型。

文章来源于网络。发布者:火星财经,转载请注明出处:https://www.sengcheng.com/article/18536.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
火星财经的头像火星财经
上一篇 2025年2月3日 下午3:00
下一篇 2025年2月3日 下午3:00

相关推荐

  • 睡个好觉!亚朵星球酒店专用慢回弹记忆棉枕大促125.5元

    天猫亚朵星球旗舰店,慢回弹记忆枕(70*42*6cm)日常售价 243 元,今日限时领取67优惠券,叠加打折优惠,到手价为 139.44 元。 88会员领九折劵,到手125.5元。 亚朵记忆棉枕头,柔软舒适,超强回弹力,细腻有质感。 有助于改善睡眠困扰,高密度记忆棉,抗压性强,更好承托颈椎。 购买链接:天猫(券后125.5元) 购买提醒:天猫亚朵星球旗舰店商…

    2025年5月29日
    22200
  • 1:1复刻北京故宫建筑群!卫星眼里的“中国好莱坞”

    横店影视城,被称为中国好莱坞,是中国规模最大的影视拍摄基地、影视文化旅游综合体。 它位于浙江省金华市东阳市横店镇,占地面积超过30平方公里,拥有多个仿古建筑群和现代影视拍摄场景。 秦王宫是横店影视城的标志性景区之一,以秦朝咸阳宫为原型建造,气势恢宏,展现了秦汉时期的壮丽建筑风格。 明清宫苑是横店影视城核心景区之一,1:1复刻北京故宫建筑群,完美再现明清皇家宫…

    2025年8月3日
    11500
  • 没它iPhone、战斗机造不出!美国欧洲印度等集体求供应:我国稀土为何这么强

    6月7日消息,稀土有多重要,没有它美国的F35、苹果的iPhone、你天天开的汽车等都是无法造出来的,而随着我国对稀土管控后,全球都急坏了。 继续美国、欧洲向中国喊话求供应稀土后,现在印度也坐不住了。 据印度媒体报道称,随着稀土储备即将耗尽,印度汽车制造商感受到了日益增加的出口管控压力,担忧生产线将很快陷入停摆。 日媒引述一名印度业内高管的话称,供应商通常备…

    2025年6月7日
    12700
  • Windows 11锁屏界面将迎大变革!更加个性化、直接显示电池电量

    7月8日消息,Windows 11的锁屏界面即将迎来一场重大变革,多年来Windows的锁屏界面一直相对稳定,但如今微软决定投入资源,使其变得更加功能化和个性化。 这些更新将从2025年夏季和秋季开始逐步推出,目前欧盟用户已经可以体验到部分新功能,而其他地区的用户则需要等待几个月才能完全享受到全新的Windows 11锁屏体验。 此次更新中最显著的变化是锁屏…

    2025年7月8日
    19200
  • 小鹏汽车启动智驾小蓝灯硬件OTA众筹升级计划:P7、G6、G9、X9全都有

    2月28日消息,小鹏汽车董事长何小鹏今日发文称,鹏友们的呼声我们都听到了,新款G6带来了大家想要的AI智驾小蓝灯,让智驾路人皆知。 老车主们不要急,我们也给大家准备了小蓝灯硬件OTA众筹升级计划。 从公布的海报中可知,小鹏汽车将开启AI智驾小蓝灯硬件OTA众筹升级计划,涵盖车型包括P7、P7i、G6、G9、X9等。 据小鹏官方透露,小鹏智驾小蓝灯的众筹价格在…

    2025年2月28日
    16400

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信