蛇年除夕夜,硅基流动创始人袁进辉没有留在饭桌上,而是抓紧时间与技术团队开会,解决DeepSeek模型在国产芯片上的适配问题。经过三天三夜的努力,他们联合华为和DeepSeek,在2月1日上线了基于国产芯片服务的DeepSeek-V3和DeepSeek-R1。此时,距离DeepSeek AI智能助手登顶中美两国App Store免费应用榜还不到一周。
过去三年,每年春节前后都会迎来一波AI热潮。2023年,ChatGPT引爆了国内大模型创业热;2024年,视频生成模型Sora震撼所有人;今年,主角变成了DeepSeek。这家低调但技术开放的中国公司改变了AI大模型的世界格局。
2024年底及2025年初,DeepSeek发布新一代MoE模型V3以及推理模型R1,凭借高性能、低训练成本和对齐OpenAI o1两项表现,迅速走红。截至2月8日,DeepSeek国内APP端日活为3494万,海外APP端日活达3685万,直追ChatGPT。
这一变化首先冲击了Meta,其Llama系列模型曾是全球开源大模型的领头羊。如今,DeepSeek用更低的成本做出了更好的模型并免费开源,让Meta处境尴尬。随后英伟达也受到冲击,市场担忧DeepSeek带来的低成本模式会减少算力需求,导致英伟达市值一夜蒸发近6000亿美元。
几乎所有与大模型行业相关的企业都在春节忙着加入这场巨浪,希望承接背后的流量红利。全球主流云厂商迅速跟进部署DeepSeek API,多家国产AI芯片厂商宣布适配DeepSeek不同尺寸模型。国内投资者的热情也被点燃,由AI产业链公司构成的DeepSeek概念股在二级市场连续多日普涨。
而在聚光灯外,大模型“六小虎”面临的行业质疑再度抬头。一年前,这些初创公司被资本选中要跟OpenAI打擂台,但现在它们在多个维度全面落后。
在今年的达沃斯论坛上,许多老外向Fusion Fund创始合伙人张璐打听起DeepSeek。这家公司成立于2023年,脱胎于知名量化基金幻方量化,目前没有进行任何外部融资。创始人梁文锋1985年出生于广东湛江,2010年从浙江大学毕业,一直在从事量化交易相关工作,并创立了杭州幻方。
DeepSeek成立后非常低调,但在AI技术圈内,自去年年中起就因其创新得到了业内认可。半年多以前,OpenAI和Anthropic的员工就在谈论这家公司。最近DeepSeek-V3和DeepSeek-R1的出现成为一个转折点,尤其是DeepSeek-R1复现了OpenAI o1推理模型能力,且完全免费。
DeepSeek的核心突破在于算法优化和算力效率的提升,尽管模型项目开源,但公司独有的技术具有相当高的壁垒。硅谷工程师们开始反思自己的巨额投入是否值得。DeepSeek的创新不仅降低了成本,还大幅提高了效率,这使得全球科技巨头纷纷增加资本开支,投资数据中心等AI基建项目。
此外,DeepSeek的创新对国产算力芯片也是一大利好,提供了更多软件算法的创新空间。DeepSeek的成功也给其他大模型公司带来了压力,“六小虎”不得不调整策略,加快创新步伐。一些公司甚至开始考虑开源模型,以应对DeepSeek的挑战。
DeepSeek的崛起不仅影响了竞争对手,也为整个AI产业链带来了新的机会。教育公司、手机厂商、证券行业等纷纷接入DeepSeek,利用其模型提升业务。未来可能会涌现大批ISV公司利用开源大模型以低成本服务市场,带来更多独立小厂的机会。投资者也开始将目光转向AI产业链的其他变革机会,例如具身智能、边缘计算、智能硬件等领域。
主题测试文章,只做测试使用。发布者:火星财经,转转请注明出处:https://www.sengcheng.com/article/30726.html