梁文锋“反对”张一鸣 小力出奇迹挑战大力神话

眼下最受关注的AI新星、DeepSeek创始人梁文锋正与张一鸣背道而驰。1月28日,DeepSeek发布了新一代多模态大模型Janus-Pro,分为70亿和15亿参数量两个版本,并且均为开源。发布后不久,该模型便登上了知名AI开源社区Hugging Face的热门榜前列。

梁文锋“反对”张一鸣

相比去年11月发布的JanusFlow,Janus-Pro优化了训练策略、扩展了训练数据,模型更大,在多模态理解和文本到图像的指令跟踪功能方面取得重大进步,同时增强了文本到图像生成的稳定性。根据DeepSeek的测试结果,这款文生图大模型在多项基准测试中表现出色,甚至强于OpenAI旗下的DALL-E 3以及Stable Diffusion。尽管用户指出Janus-Pro并不全面超越DALL-E 3,但其以较小的参数量展现了不俗潜力。

梁文锋“反对”张一鸣 小力出奇迹挑战大力神话

本月早些时候,DeepSeek还发布了R1大模型。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能号称可以比肩OpenAI当前最强的o1模型正式版。更重要的是,DeepSeek仅花费了相当于OpenAI零头的资金和资源,就拿出了堪与o1比肩的产品。这表明“小力出奇迹”的策略在DeepSeek身上屡试不爽。

梁文锋“反对”张一鸣 小力出奇迹挑战大力神话

这种低成本高效率的做法对行业产生了冲击。例如,1月27日美股交易中,英伟达股价暴跌17%,市值蒸发约4.3万亿人民币。然而,长期来看,芯片依然是AI大模型发展的基石,英伟达作为这一领域技术壁垒最坚固的公司,其“卖铲者”的长期价值依然坚挺。

梁文锋“反对”张一鸣 小力出奇迹挑战大力神话

字节跳动自2023年进军AI大模型以来,投入大量资金和资源,快速扩充AI业务矩阵,发布十几款大模型及十几个AI应用。尽管如此,“小力出奇迹”的DeepSeek让字节看似无可置疑的“大力”打法遭遇挑战。DeepSeek不仅在AI技术和产品上打破了旧思维,也在不经意间点破了“大力出奇迹”并非放诸四海皆准的商业真理。

Janus-Pro的成本相对较低,使用轻量级分布式训练框架,1.5B参数模型大约需要128张英伟达A100芯片训练7天,7B参数模型则需要256张A100芯片和14天训练时间。这样计算下来,模型训练成本可低至数万美元。性能方面,Janus-Pro通过将多模态理解和生成统一起来,提升了视觉编码解耦的能力。在实际应用中,无论是文生图还是图生文,Janus-Pro都表现良好。

Janus-Pro继承了DeepSeek的开源传统,使用MIT协议,个人和中小企业可以省去不少费用。此外,由于模型体量小,Janus-Pro可以在PC端安装并本地运行,进一步降低了使用成本。

相比之下,国外秉持“大力出奇迹”的OpenAI近期遇到一些问题。例如,其文生视频大模型Sora虽然震撼亮相,但随后效果不尽如人意,被谷歌等竞争对手抓住机会嘲讽。尽管如此,OpenAI仍坚持堆芯片、堆算力的路线,计划未来四年投资5000亿美元用于AI基础设施。

字节跳动的核心产品豆包大模型在知识、代码、推理等多项公开测评基准上得分优于GPT-4o和DeepSeek-V3,但其投入同样惊人。据传今年将投入超过120亿美元用于AI基础设施,不过字节对此回应称相关消息并不准确。

DeepSeek通过“小力出奇迹”的方式展示了新的技术路线和商业哲学,打破了传统的大厂主导逻辑。这表明中小厂商完全可以用更少的资源做出更好的产品,从而得到市场和投资者的认可。

责任编辑:张蕾

主题测试文章,只做测试使用。发布者:火星财经,转转请注明出处:https://www.sengcheng.com/article/15229.html

(0)
火星财经的头像火星财经
上一篇 2025年1月29日 下午12:25
下一篇 2025年1月29日 下午12:25

相关推荐

  • 正月不理发的习俗从何而来 背后的文化意义

    正月不理发是许多地方过年的传统习俗之一。这个习俗背后有着有趣的故事和深厚的文化内涵。 在中国,过年是一件大事,各种与春节相关的习俗层出不穷。正月不理发这一习俗看似简单,却蕴含着丰富的文化和历史意义。古时候,人们认为头发是人的一部分,象征着智慧和思想。因此,理发被认为是一个影响运势的重要行为。 春节期间,很多人相信如果在正月里理发,会剪掉一年的好运气。这种想法…

    2025年1月31日
    300
  • 两派黑帮酒吧内持刀混战,香港警方介入调查

    2025年1月22日清晨,一起震惊香港的谋杀案在喜业街的一栋工业大厦外发生。一名24岁、具有黑社会“和胜和”背景的陈姓男子,在离开一家无牌酒吧后,遭到了十几名持刀者的伏击,身中多刀,最终不幸身亡。 案发后,两名分别为21岁的嫌疑人迅速逃亡至泰国,试图逃避法律的制裁。然而,法网恢恢,疏而不漏。在国际刑警的协助下,泰国警方在曼谷素万那普国际机场将这两名嫌疑人逮捕…

    2025年1月25日
    1100
  • 两部门发布2月灾害风险形势 多类灾害需警惕

    近日,国家防灾减灾救灾委员会办公室、应急管理部会同自然资源部、水利部、农业农村部、中国气象局、国家能源局、国家林草局等部门召开会商会,对2025年2月份及春节期间全国自然灾害风险形势进行研判。 综合分析认为,2月份,新疆中部、黑龙江、西北东部等地存在阶段性大风和雪灾风险,西北东南部、西南东部等地存在阶段性低温雨雪冰冻灾害风险;华南、华东、华中、西南等部分地区…

    2025年1月28日
    1000
  • 春节将有超140万人进出香港 精彩活动迎新春

    香港特区行政长官李家超今日(21日)宣布,农历新年期间,香港将举行一系列精彩活动,预计在内地春节假期期间,将有超140万人次内地旅客经各个口岸进出香港。(大湾区之声) 责任编辑:张小花 TT1000

    2025年1月21日
    1000
  • 今冬以来最强雨雪来袭 寒潮预警发布

    中央气象台于1月23日6时发布了今年首个寒潮蓝色预警。从23日至27日,我国将迎来入冬以来影响范围最广、强度最强的降水过程。 此次寒潮携大范围雨雪天气而来,全国大部分地区将受到影响。预计陕西南部、山西南部、河南西北部、湖北西北部、四川南部、辽宁东部等地降雪较强,新增积雪深度可达3至8厘米,局部地区甚至超过12厘米。24日,甘肃、山西、陕西、河南等地的连霍、京…

    2025年1月23日
    1200

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信