中国人工智能领域,尤其是大型语言模型技术近期取得了显著进展。这些成就让美国试图打压中国科技发展的政策显得尴尬。
世界经济论坛2025年年会开幕当天,中国深度求索公司发布了最新的开源模型DeepSeek-R1。该模型在技术上实现了重要突破,使用纯深度学习方法使AI自发涌现出推理能力。DeepSeek-R1延续了高性价比的优势,在后训练阶段大规模使用强化学习技术,即使只有极少标注数据也能大幅提升模型的推理能力。在数学、代码和自然语言推理等任务上,其性能与美国OpenAI的o1模型正式版相当。
中国AI技术在世界经济论坛2025年年会上成为热议话题。麻省理工学院知名AI专家马克斯·特格马克教授在接受采访时表示,过去一年里,中国在AI领域取得了巨大进步。他高度赞扬了中国深度求索公司最新发布的大型语言模型,并指出中国已基本赶上美国在前沿大型语言模型上的发展,这凸显了因地缘政治破坏科技合作的愚蠢和错误。
去年9月,OpenAI发布了推理模型o1。几个月后,阿里巴巴的通义千问团队推出了实验性研究模型QwQ-32B-Preview,该模型在多个测试中展现出与o1模型相当甚至超越的推理能力。随后,中国深度求索公司在2024年12月下旬发布了混合专家模型DeepSeek-V3。测试结果显示,DeepSeek-V3在多项评测中超越了Llama-3.1-405B等开源模型,并且在性能上与世界顶尖的闭源模型GPT-4o和Claude-3.5-Sonnet不相上下,同时具有成本优势。
此外,OpenAI在2024年初发布视频生成模型“天空”后,中国短视频平台快手公司在同年6月推出了视频生成大模型“可灵”。随后几个月内,智谱AI、字节跳动和腾讯等多家中国公司也相继推出类似工具。
英国《经济学人》杂志撰文指出,中国最近的进展正在颠覆整个AI行业,令美国政策制定者感到尴尬。中国模式的成功可能会重塑AI行业的经济模式。美国《纽约时报》的一篇文章提到,中国公司打造了一款更便宜、更有竞争力的模型,与谷歌和OpenAI等美国巨头的产品相比毫不逊色。
乔治·华盛顿大学助理教授杰弗里·丁表示,美国对中国芯片的限制迫使中国工程师更有效地训练模型,使其仍然具有竞争力。
除了大型语言模型,物理AI也将为中国带来良好机会。中国禾赛科技联合创始人李一帆在达沃斯论坛期间指出,当数字世界的AI与物理产品结合时,中国企业在供应链、制造能力、成本控制等方面具有明显优势。
主题测试文章,只做测试使用。发布者:火星财经,转转请注明出处:https://www.sengcheng.com/article/10804.html