媒体:DeepSeek不需要被神话 理性看待其成就

1月27日,DeepSeek AI智能助手登上中美iOS免费应用排行榜榜首,这是中国应用首次取得这一成绩。与此同时,与该公司相关的多个词条进入微博热搜,其中一条是“DeepSeek彻底爆发”。这背后反映了开源模型追赶甚至超越闭源模型的情绪。

事实上,DeepSeek在这几天并没有特别的动作,将其推上舆论中心的力量主要来自Meta。三天前,在美国匿名职场社区teamblind上,有Meta员工表示,DeepSeek的低成本训练工作让Meta的生成式AI团队感到恐慌,工程师们正努力分析DeepSeek,试图从中复制任何可能的东西。随后,Meta首席人工智能科学家杨立昆在X平台上表示,对于认为“中国在人工智能领域正在超越美国”的人,正确的看法是“开源模型正在超越闭源模型”。

DeepSeek并不是突然崛起。从DeepSeek-V2开始,这家公司已被硅谷视为一股神秘力量。它在国内大模型行业率先发起了一场真正意义上的“降价潮”,凭借“MoE+MLA”架构创新实现了成本降低。近期热议的原因在于它在过去一个月内相继发布了DeepSeek-V3和R1两款大模型产品。

2024年底,DeepSeek发布新一代MoE模型DeepSeek-V3,拥有6710亿参数,激活参数为370亿,在14.8万亿token上进行了预训练。V3在知识类任务上接近当前表现最好的Claude-3.5-Sonnet-1022,在代码能力上稍好于后者,并且在数学能力上领先其他开闭源模型。更重要的是,DeepSeek-V3的总训练成本仅为557.6万美元,完整训练消耗了278.8万个GPU小时,几乎是同等性能水平模型所需成本的十分之一。

一周前,DeepSeek发布了推理模型R1,其性能对齐OpenAI-o1正式版,并同步开源模型权重。R1在多项任务上与OpenAI-o1-1217基本持平,尤其在AIME 2024、MATH-500、SWE-Bench Verified三项测试集上以微弱优势取胜。此外,R1还开源了仅通过强化学习训练的大语言模型R1-Zero,尽管没有人类监督数据介入,但该模型足以对标OpenAI-o1-0912,探索出仅通过强化学习就能获得推理能力的技术可能性。

一名大模型行业投资人表示,虽然DeepSeek-V3是目前最好的开源模型,但说它能与头部闭源模型抗衡还为时尚早。杨立昆也指出,DeepSeek受益于开源研究和技术,提出了新想法并基于他人的工作进行创新,所有人均能从中获益。

R1在没有复杂技术的前提下实现了o1水平的推理性能,学会了长链推理和反思。不过,一些行业人士认为R1可能存在局限,特别是在过程奖励和树搜索技术方面。最近OpenAI发布的o3和o3-mini性能大幅提升,显示国内大模型公司仍有加速创新的压力。

除了技术讨论,DeepSeek的战略性上线C端智能助手应用也让大众直观感受到V3和R1的技术价值,一度导致服务“宕机”。用户普遍强调其性能强大、价格便宜,但也存在一些短板。

从公司发展角度看,DeepSeek证明了一个短小精悍、扁平高效的组织架构可能是面向AGI的大模型研发的有效创业形态。Meta计划在2025年投入超过600亿美元用于人工智能,进一步凸显了DeepSeek低训练成本和高创新效率的价值。

如今,DeepSeek已成为中国企业中可以与OpenAI、Meta等公司竞争的存在,但它无需被神话。创始人梁文峰表示,随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。

责任编辑:张佳鑫 0764

主题测试文章,只做测试使用。发布者:火星财经,转转请注明出处:https://www.sengcheng.com/article/13760.html

(0)
火星财经的头像火星财经
上一篇 2025年1月27日 下午10:58
下一篇 2025年1月27日 下午10:58

相关推荐

  • 韩国围棋协会将修改“死子”围棋规定 争议频发引关注

    在韩国举行的第29届LG杯世界围棋棋王战冠亚军决赛三番棋第二局中,中国棋手柯洁因两次未按照规则要求将提掉的对方“死子”放入棋盒盖里,被判犯规负。这一事件引发了对韩国围棋规则的关注和讨论。 实际上,在世界棋战中因为“死子”问题发生争议的情况并非首次。2004年三星杯预选赛中,中国棋手黄奕中与韩国棋手金江根的比赛就曾因“死子”数量争议而重赛。2010年三星杯预选…

    2025年1月24日
    1100
  • WTT新加坡站双打抽签结果出炉 国乒组合迎战强敌

    北京时间1月31日,WTT大满贯新加坡站抽签仪式举行。在混双项目中,林诗栋/蒯曼与韩国组合申裕斌/赵大成同处1/4区。男双方面,王楚钦/林诗栋组合与法国的勒布伦兄弟位于上半区。女双比赛中,孙颖莎/王艺迪可能在第二轮对阵韩国组合申裕斌/李恩惠。 混双签表如下:林诗栋/蒯曼、姆拉德诺维奇/倪夏莲VS卢伟/高桥·朱丽叶、西蒙·高茨/帕瓦德vsE·约内斯库/斯佐克斯…

    2025年1月31日
    500
  • 晒晒我家新年货 智能家电添新意

    四川省广安市广安区一家商场内,前来消费的顾客络绎不绝。赵海的妻子安娟娟正在使用智能洗衣机。马瑞晨展示了他购买的手机和智能手表。廖创一家人出游途中与新车合影。 一份年货不仅饱含心意,也反映出消费市场的新趋势。随着“两新”政策的实施以及各地促消费措施的出台,春节市场的热度进一步提升。今年春节期间,许多消费者选择了一些新颖且富有特色的商品作为年货。 湖南长沙太平老…

    2025年2月2日
    200
  • 金价还能推多高 春节买金热助力攀升

    春节期间,黄金价格再次创下历史新高,一度成为热门话题。1月30日,现货黄金价格最高达到2799.86美元/盎司;31日,COMEX黄金期货价格最高涨至2859.5美元/盎司。今年以来,金价累计涨幅接近8%。 随着金价上涨,金店的足金首饰价格也相应上调,例如周大福等多家金店的价格达到每克846元。尽管如此,深圳、上海等地的金店仍出现了排队购金的现象。 2024…

    2025年2月1日
    300
  • 翟欣欣敲诈勒索案择期宣判 案件刑事部分首次审理

    1月21日,翟欣欣涉嫌敲诈勒索一案在北京海淀区人民法院山后人民法庭开庭。苏享茂家属透露,案件择期宣判,翟欣欣当庭认罪认罚。 2017年9月7日凌晨,WePhone创始人苏享茂坠楼身亡。他在遗书中提到,闪婚前妻翟欣欣索要了数百万财物,并逼迫他签下1000万元的离婚赔偿协议,导致公司资金链断裂。 翟欣欣曾公开回应称,在婚后遭到苏享茂殴打和虐待。她还表示,苏享茂自…

    2025年1月22日
    1200

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信