国产大模型发展史:大模型竞争进入“后暴力计算时代”

AI竞技场正静静见证着一场深刻的技术权力腾挪。

这场由DeepSeek引发的变革仍未见平息,大模型竞争进入“后暴力计算时代”,效率的重要性跃然纸上,而AI权力也面临重构,OpenAI“一家独大”的局面正不断受到冲击。

后浪凶猛进化,前浪披荆斩棘,“城头变幻大王旗”赢家尚未有定论,如何既通过开源获取生态的加持,又利用闭源实现商业变现,才是决胜的关键。

01、中国AI项目乘政策风“井喷”

国产AI的发展在不声不响间悄然酝酿。2023年被业内人士视为人工智能发展的分水岭。

人工智能科学家李飞飞曾说:“在历史上,2023 年有望因技术的深刻变化和公众觉醒而被人们铭记。”

而在此之前,关于人工智能的技术探索和创新早已不胜枚举。

1956年约翰·麦卡锡在达特茅斯会议上首次提出“人工智能”(Artificial Intelligence)概念,AI作为一门学科正式诞生。

但到了1973年,由于AI研究遭遇瓶颈,对AI的资金投入大幅缩水,发展进入 “寒冬”。

1986年,直到“AI教父”杰弗里·辛顿(Geoffrey Hinton)提出了反向传播(Backpropagation)算法,神经网络的复兴让AI发展再迎曙光,再到2017年Google提出基于自注意力机制(Self-Attention),取代RNN/LSTM,成为后续大语言模型(LLM)的核心架构……

回望国内的AI发展历程,2023年同样是“国产AI时代开启元年”。

据天眼查,仅2023年上半年与大模型直接相关的融资事件超20起,国内已发布的各类大模型数量超过100个,而到了2024年7月时完成备案并上线的生成式AI大模型数量接近200个。

直到今天,有机会冲进决赛圈的依然只有十几家。咨询机构弗若斯特沙利文指出,我们目前在通用基础大模型领域的竞争者已缩减至20余家,主要由互联网企业、云计算巨头及人工智能创业公司主导。

大家都是这场没有硝烟的“战争”的亲历者,站在2025年的开年回望,或许是经历了2024年 “百模大战”的大浪淘沙,DeepSeek才得以在2025年开年在全球科技行业投掷下“惊雷”,推动国产AI实现了”关键一跃”,站稳脚跟。

拥有持续创新能力的企业逐渐占据市场主导,从图文转视频到多语言广告生成,人工智能的应用范围正在迅速拓展。

与此同时,大模型和智能体技术也进入了加速发展阶段。无论是C端的用户体验优化,还是B端的企业解决方案,智能体和大模型正在重新定义技术与社会的连接方式。

决赛圈里目前有三股力量:一是阿里巴巴、字节跳动代表的互联网大厂、云服务商,介入大模型;二是科大讯飞代表的人工智能国家队,以G/B/C联动的方式,既做解决方案又做硬件产品;三是智谱、DeepSeek等AI创业公司,少数还在坚持基础模型创新。

产业链上下游处境分化,模型厂商发展路径分野。即便“AI六小虎”,也面临道路分化。例如,百川智能已转向医疗等行业大模型;零一万物将超级大模型训练交给阿里;月之暗面和MiniMax专注做C端应用和产品。

业内人士普遍认为,与产业链上下游相比,处于中游的模型厂商普遍面临盈利困境。2025年,大模型决赛圈的选手,还能在基础大模型层创新的企业,会进一步减少。

02、从“烧钱信仰”到“效率革命”

如果说“成本、AI Agent、多模态”是当下AI产业的三个关键词,代表着2024年大模型的进化方向,那么它们或许也代表着大模型迈向产业落地的关键节点。

首先,成本无疑是决定企业生死的关键,训练和部署大规模 AI模型对计算资源的庞大需求不容忽视,这也使得企业必须背负高昂的计算成本和运维成本。

DeepSeek-R1也正是抓了企业在效率和成本控制上的痛点,实现了在相对较低的算力投入下,可媲美甚至超越头部模型的性能表现。

传统人工智能发展模式往往依赖于“规模至上”的逻辑,追求超大规模模型和超大规模算力集群。DeepSeek R1的轻量化模型和开源策略,降低了人工智能应用的门槛,促进了中端算力设施和分布式数据中心的普及。

产业链上游的英伟达,因DeepSeek的出现开始面临一定需求结构调整的压力。

ASIC芯片厂商则迎来了新的发展机遇。由于ASIC芯片能够针对特定人工智能应用进行硬件加速,在能效比和成本控制上具有明显优势,更适应分布式算力发展的趋势。

对于算力服务端来说,区域性数据中心凭借低时延和贴近应用场景的优势,开始承接制造业智能质检、金融风控等对延迟敏感的应用需求。

AWS、阿里云等云计算巨头调整部分大型数据中心的建设策略,加大在边缘计算和分布式算力布局方面的投入。

而应用端则将受益于算力成本的下降,驱动人工智能在制造业、金融、医疗等领域的渗透加速。

在代码托管平台GitHub上,已涌现出大量基于DeepSeek模型的集成应用案例(awesome deepseek integration),形成“需求牵引供给”的正向循环,实现“算力+行业”的双向赋能。

人工智能技术将加速渗透到各行各业,成为推动产业升级和经济发展的重要引擎。

但值得关注的是,DeepSeek R1的技术突破,在降低人工智能应用门槛的同时,也可能引发“杰文斯悖论”。

杰文斯悖论由19世纪经济学家 William Stanley Jevons提出,他发现,随着煤炭使用效率的提高,煤炭的消耗总量反而增加。这一悖论揭示了一个深刻的经济规律:效率的提升并不必然导致资源消耗的减少,反而可能因为成本降低和应用范围扩大,刺激需求增长,最终导致资源消耗总量增加。

微软 CEO 萨提亚·纳德拉引用杰文斯悖论来解释DeepSeek R1可能带来的影响,可谓一针见血。

纳德拉认为,更实惠、更易于访问的人工智能技术,将通过更快的普及和更广泛的应用,导致需求的激增。随着人工智能技术的门槛降低,过去由于成本限制而无法应用人工智能的领域,例如中小企业、边缘计算场景等,将涌现出大量新的应用需求,从而导致算力调用密度指数级上升。

新兴应用场景的爆发,也将加速算力需求的裂变。智能驾驶、具身机器人等前沿领域对实时算力的需求极为庞大,远超DeepSeek技术优化的速度。即使单任务效率提升数倍,百万级智能终端的并发需求,仍将形成巨大的算力吞噬黑洞。

03、“开源”与“闭源”的协同

随着开源大模型DeepSeek的“爆火”,“开源”和“免费”等关键词频现。

如果说,在DeepSeek之前,国内大模型企业关于“开源”和“闭源”的路径仍多有分歧,现在“开源”、“开放生态”、扩大朋友圈的呼声似乎成了主流。

在DeepSeek这条鲶鱼的冲击之下,国内大模型企业展示出更“开放”的姿态,希望加快建立自己的开发者生态和应用生态。

而开源模型和闭源模型的关键差异,则可以从基础条件、技术层面和商业化三个维度来观察。

从基础条件看,开源模型以公开数据集、社区贡献数据为数据来源,以分布式的、开发者自有的GPU集群为算力支撑,为开发者、研究者、企业等提供了平等的接入机会,促进了技术的创新和共享。

闭源模型则是由公司或团队开发,以专有数据如用户行为日志、私有数据库、清洗后公开数据为数据来源,用户只能根据公司提供的接口或平台使用这些模型。

从盈利场景看,开源模型本身并不直接带来收益,但它们通常通过附加服务(如云计算、技术支持、培训、定制化开发等)来实现营利。公司可以通过商业化的方式提供增值服务,依托开源模型形成可持续的收入来源。

闭源模型的商业化路径相对直接,企业通过授权许可、订阅服务、平台收费等方式实现营利。闭源模型能为公司带来高利润,因为客户需要为其使用权限和服务支付费用。

开源与闭源并非“水火不融”,未来很可能会形成开源与闭源相互作用的形式,开源加速了AI技术的普及和创新,而闭源则确保技术能够在商业上获得长足发展并维持稳定性。

未来的赢家将是能同时掌握开源和闭源能力的多面手,,既通过开源获取生态势能,也利用闭源实现价值捕获。

正如纳德拉所说,“超大规模AI不会出现赢者通吃的局面,开源模式将制衡闭源。”

尾声

DeepSeek 在当下的AI时代将扮演重要角色,就像 Android 之于移动互联网革命。

重构产业生态,引发链式反应,加速上层应用发展与下层系统统一。这将调动起跨越软硬件和上下游的生态力量,促使各方加大 “模型 – 芯片 – 系统” 协同优化与垂直打通的投入,进一步削弱 CUDA 生态优势,为国产 AI 产业发展创造机遇。

DeepSeek 通过技术创新,在 AI 模型训练过程中实现了对高端进口芯片依赖的降低,这为国内企业展示了一条可行的技术路径,极大地增强了国内企业自主研发算力芯片的信心。

博弈,不仅仅是开源以及闭源的技术选择,更是涉及 AI 发展的话语权、市场主导权以及算力的分配的角逐。而这场AI权利争夺战已然开始。

*:not([class*=”icon”]):not([class*=”fa”]):not([class*=”logo”]):not([class*=”mi”]):not([class*=”code”]):not(i){font-family:PingFang SC,Arial,”Material Icons Extended”,stonefont,iknow-qb_share_icons,review-iconfont,mui-act-font,fontAwesome,tm-detail-font,office365icons,MWF-MDL2,global-iconfont,”Bowtie” !important;}[class*=”code”]{font-family: Consolas !important}

主题测试文章,只做测试使用。发布者:火星财经,转转请注明出处:https://www.sengcheng.com/article/34033.html

(0)
火星财经的头像火星财经
上一篇 2025年2月24日 下午1:58
下一篇 2025年2月24日 下午2:01

相关推荐

  • 母婴护理逆势大增20%+,谁在改写“存量市场”定义?

    当母婴行业被普遍视为“存量市场”时,2024年母婴护理赛道的线上表现却实现了一次“反常识”的逆势增长: 1、母婴护理品类在线上三大主流渠道总销售额同比激增21.8%,整体规模突破185.53亿元; 2、国货品牌全面崛起,占据线上TOP20榜单的15席,彻底打破外资主导的竞争格局。以贝德美、海龟爸爸为首的头部品牌稳居第一梯队,而袋鼠妈妈、飞虎牌等新锐品牌则以超…

    2025年3月17日
    2600
  • 1月每天新开店111家,连锁咖啡又行了?

    2025年,连锁咖啡品牌们开了个好头。 1月,壹览商业长期跟踪的30家连锁咖啡品牌新开门店3460家,环比增加59.64%,同比增加19.48%,门店总数达到55314家。其中,瑞幸以22352家门店稳居第一,库迪咖啡门店数量正式破万,达到10045家,位列行业第二,星巴克则以7795的门店数量位列第三。 春节前无疑是各大品牌“冲业绩”的黄金时刻,1月新开门…

    2025年3月2日
    3800
  • 棉花娃娃,让00后“无痛当妈”

    吃饭前先拍下“宝宝”跟食物的合影、旅游时镜头对焦的是可爱“崽崽”、生日时还要和“娃娃”一起在餐厅切庆生蛋糕……然而这些备受年轻人宠溺的“崽崽”们可不是真正的小孩,而是萌感十足、触感柔软的棉花娃娃。 从追星应援产物到二次元同人二创制品,再到无属性棉花玩偶,棉花娃娃凭借可爱软萌的外表、能够自由装扮的高可玩性,以及能够提供情感陪伴和治愈减压的情绪价值,俘获了大批年…

    2025年3月22日
    3000
  • 盒马NB,NB在哪?

    近日,上海盒马X会员店高青店、大场店、东虹桥店于4月1日起集体停业,引起了业内广泛讨论。 曾经对标山姆的中国超市,如今突然不香了? 其实也早有端倪,2024年底时,盒马CEO严筱磊在内部信中就透露过,盒马将要更加聚焦“盒马鲜生”及“盒马NB”两个核心业务。 今年除了关闭部分盒马X会员店,盒马还计划于2025财年开一百家盒马鲜生。 此次战略上的调整,背后意味着…

    2025年4月9日
    1900
  • 春节档联名启示:爆款难押,品牌玄学仍然待解

    在《哪吒之魔童闹海》成为中国影史票房冠军的同时,吒儿正在银幕外“疯狂搞钱”。 与其联名的泡泡玛特“天生羁绊”系列盲盒上架第二天便宣告售罄,官方小程序上排队“抽盒”的粉丝已经排到了5月份;蒙牛联名定制款全脂纯牛奶礼盒在京东平台销量已超百万;在发布会上官宣成为官方合作伙伴的荣耀则是让全国超 2000 家荣耀门店同步进行哪吒主题焕新,并在产品端加入哪吒主题特效等联…

    2025年2月7日
    2700

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信