在人工智能芯片的竞争中,英伟达凭借其强大的技术实力和完整的生态系统,构筑了难以逾越的壁垒。然而,随着AI应用场景的扩展,特别是在推理阶段的需求爆发,AMD等竞争者正在寻找突破口。
最新消息显示,AMD利用DeepSeek模型走红的机会,宣布将新的DeepSeek-V3模型集成到Instinct MI300X GPU上。这一集成旨在与SGLang配合使用,以实现最佳性能。DeepSeek-V3专门针对AI推理进行了优化,表明AMD正在积极布局AI应用落地场景。
这种合作反映了AI行业格局的变化。过去两年,大模型的训练需求主导了算力市场,英伟达凭借CUDA生态和H100系列GPU占据绝对优势。但随着大模型进入应用落地阶段,推理需求激增,企业更关注成本、能效和部署灵活性。AMD瞄准这一窗口期,试图通过优化推理性能打破英伟达的垄断。
AMD的Instinct MI300X是其AI战略的核心武器。这款采用Chiplet设计的GPU集成1460亿晶体管,配备192GB HBM3内存,专为大规模AI推理设计。据AMD数据,MI300X的推理性能较英伟达H100提升30%,内存带宽达5.3TB/s,尤其擅长实时对话、图像生成等低延迟任务。不过,MI300X面临生态短板和产能瓶颈两大挑战。
英伟达的CUDA生态已形成近乎垄断的开发者壁垒,全球90%的AI框架依赖其工具链。尽管AMD推出开源的ROCm平台并适配PyTorch、TensorFlow,但迁移成本高、社区支持不足的问题依然突出。例如,Meta虽采用MI300X运行Llama 3.1模型的推理任务,但训练阶段仍依赖英伟达芯片。此外,2023年底台积电先进封装产能紧张导致MI300X交付延迟,部分客户转投英伟达,也暴露出AMD在供应链管理上的脆弱性。
为应对挑战,AMD加速硬件迭代并强化生态合作。2024年6月,AMD推出了升级版的MI325X芯片,这款产品采用了8个计算芯片、4个I/O芯片和8个内存芯片的复杂设计,通过2.5D和3D封装技术实现整合。在性能方面,MI325X提供了1.3petaFLOPS的BF/FP16性能,或2.6petaFLOPS的FP8性能,超过了英伟达的H200。特别是在内存容量上,MI325X配备了288GB的HBM3e内存,是H200的两倍多,内存带宽达到6TB/S。
然而,MI325X依旧存在明显短板。与英伟达的产品相比,AMD在FP8(8位浮点数)支持方面存在劣势。由于软件库vLLM对FP8支持有限,AMD不得不在许多基准测试中使用FP16,这意味着相同规模的AI模型在AMD芯片上需要更多内存。
面对这些技术挑战,AMD已经规划了明确的产品路线图。AMD计划2025年推出MI355X,性能较MI325X再提升80%,并采用3nm工艺。更重要的是,AMD还暗示了代号为“CDNA next”的下一代产品将带来“重大架构升级”,可能包括异构多芯片部署或光子内存扩展等创新技术,并将支持FP4和FP6数据类型,这一改进有望解决目前在低精度计算方面的短板。
除了技术创新,AMD还通过一系列战略投资加强其在AI领域的竞争力。2024年7月,AMD以6.65亿美元收购欧洲最大私人AI实验室Silo AI。这家实验室拥有300名专家,在开发定制化大语言模型和MLOps工具方面具有深厚积累。此次收购有效补强了AMD的AI服务能力:Silo AI能够为客户提供从模型训练到部署的全流程支持,而AMD则可以借此将硬件、软件和服务整合为完整的“端到端解决方案”。值得一提的是,Silo AI为欧洲企业开发的“主权AI”模型(如支持欧盟多语言的Poro和Viking)已经在AMD平台上直接运行,这为AMD在欧洲市场构建起独特的区域性优势。
2024年12月,AMD领投了MIT初创公司Liquid AI的2.5亿美元A轮融资。Liquid AI提出的“液态神经网络”摒弃传统Transformer架构,模仿线虫神经系统设计动态权重更新机制。其模型LFM-1B在自然语言处理任务中,以1/10的参数量达到同等规模模型的性能,且推理能效提升90%。这一技术有望解决Transformer在长序列建模和边缘计算中的瓶颈。AMD的押注不仅是为了抢占下一代AI架构的先机,也是为了在英伟达主导的“大模型军备竞赛”外开辟新战场。
2025年1月,AMD又以2000万美元投资AI制药公司Absci,首次进军生命科学领域。Absci利用AI从头设计抗体,借助AMD的MI300X芯片,其“集成药物创造平台”可将抗体设计周期缩短至6周。AMD看中的是生命科学领域对高效推理的需求——基因测序、蛋白质模拟等任务需要海量并行计算,而英伟达在该市场的布局尚未形成壁垒。与Absci合作,将帮助AMD扩大芯片应用场景,还可积累生物计算领域的专属优化经验。
尽管AMD在某些关键AI任务上能够提供更快的速度和更低的价格,但英伟达的优势仍然明显。英伟达CEO黄仁勋曾表示,即使竞争对手的芯片免费提供,从总拥有成本来看也无法与英伟达竞争。这种底气源自英伟达在AI软件生态系统和整体解决方案方面长期建立的优势地位。
另一方面,亚马逊、谷歌等云厂商自研AI芯片也在持续挤压第三方供应商的空间。此外,地缘政治风险也不容忽视——美国对华芯片出口限制也在迫使AMD调整中国市场策略,而英伟达凭借更早的全球化布局更具韧性。
不过,市场格局正在发生变化。随着AI芯片的主战场从训练向推理阶段转移,性价比和能效比将变得越来越重要。一些机构已经开始考虑在推理任务中使用替代方案,原因是英伟达芯片的价格和能耗都相对较高。这为AMD等竞争者提供了机会。
在接受《时代》杂志采访时,AMD CEO苏姿丰表示,AI是一个重大的技术变革机遇。她强调,AMD的优势在于能够提供端到端的AI解决方案,并在与合作伙伴协作方面表现出色。这种战略思维反映在AMD的投资布局上,从芯片研发到软件优化,从人才储备到应用场景拓展,AMD正在构建全方位的AI生态系统。
展望未来,虽然短期内难以撼动英伟达的主导地位,但随着AI应用场景的不断丰富和市场需求的持续增长,AMD通过技术创新和战略投资,正在逐步缩小与领导者的差距。在这场技术变革中,最终的赢家可能是能够为不同应用场景提供最优解决方案的参与者。
主题测试文章,只做测试使用。发布者:火星财经,转转请注明出处:https://www.sengcheng.com/article/12872.html