2月13日,一位英伟达代理商透露,春节后第一周,两家中国科技企业为了支撑开源大模型DeepSeek的推理服务,紧急采购了L20 GPU算力设备。与去年客户下单时反复考虑和比价的情况不同,现在连库存的禁售型号都被抢购一空。
DeepSeek的出现改变了市场对高性能GPU作为AI赛道核心的传统看法,导致英伟达作为高性能GPU的主要供应商被市场看空。但近期情况显示,无论是高性能的H系列GPU还是RTX 40系列高端显卡,英伟达的产品再次变得供不应求。
目前,接入DeepSeek的企业已达数百家,涉及国内云服务、互联网、手机、芯片、金融、医疗、汽车等行业。迅速增长的用户量为这些企业带来了巨大收益:云服务借此兜售算力,芯片企业推广产品,车企以更低的成本升级软件,上市公司市值也得以提升。一家IT厂商表示,其调用DeepSeek的平台在上线首日增加了上万用户,现有算力已经无法满足需求,团队不得不紧急调配更多英伟达GPU。
并行科技董事长陈健指出,当前企业在DeepSeek模型推理过程中爆发了大量的算力需求。尽管市面上有十几款国产GPU品牌,但在性能、稳定性和生态方面仍与英伟达存在差距,因此英伟达卡仍然是企业的首选。
DeepSeek发布后,英伟达股价经历了过去一年来最大跌幅17%,但自2月3日起开始反弹,回升了13%。某国内模型厂商人士认为,DeepSeek的出现让业界反思算力泡沫,但随着提供和使用模型的个人及企业数量激增,大量模型推理再次推升了对英伟达卡的需求。
DeepSeek虽然展示了强大的推理能力和优秀的文采,但提供服务所需的硬件配置非常高,至少需要两台H800卡才能运行。相比之下,大多数基础模型只需要一台4090卡就能运行。不过,开发者通常会将超过600B参数量的模型进行蒸馏,压缩到更低参数规模后再用于商业化。预计几个月后完成蒸馏后,上线DeepSeek的企业可以节省一些推理算力。
主题测试文章,只做测试使用。发布者:火星财经,转转请注明出处:https://www.sengcheng.com/article/31114.html