1月27日,中国深度求索公司开发的DeepSeek在苹果美国地区应用商店免费APP下载排行榜上超越了ChatGPT。最近发布的开源模型DeepSeek-R1引起了全球范围内的广泛关注。
舆论认为,这一低成本、开源的人工智能模型震动了硅谷,让竞争对手感到担忧,也让科学家们兴奋不已。多方评论指出,中国AI技术的快速发展,让美国的打压政策显得尴尬。1月20日,深度求索发布了最新开源模型DeepSeek-R1,此后热度不断上升,在国内外引发了广泛讨论。顶级风投A16Z创始人马克·安德森评价称,DeepSeek-R1是他见过的最惊人、最令人印象深刻的突破之一,并称赞其为给世界的一份意义深远的礼物。
在硅谷,几乎每个人都在谈论DeepSeek。有报道称,硅谷工程师正在疯狂地分析DeepSeek,甚至有人将其称为中国的“ChatGPT时刻”。DeepSeek的特点是低成本、高性能和开源。该模型的推理计算效率极高,可以与一些顶尖的AI模型相媲美,与硅谷前沿发展保持同步。
DeepSeek-R1在技术上实现了重要突破,用纯深度学习的方法让AI自发涌现出推理能力,在数学、代码、自然语言推理等任务上的性能比肩OpenAI的o1模型正式版。据DeepSeek介绍,R1的预训练费用只有557.6万美元,远低于OpenAI GPT-4o模型的训练成本。
加利福尼亚大学伯克利分校教授亚历克斯·迪马基表示,DeepSeek的技术路线揭示了一个事实:达到顶尖性能未必需要巨额投入,这对硅谷的烧钱竞赛无异于釜底抽薪。开源也是DeepSeek备受关注的原因之一,这意味着其他企业和研究人员可以共享基础代码,构建和发布自己的产品。
英伟达资深科学家吉姆·范称赞DeepSeek是“非美国公司践行OpenAI初心”的典范,通过开放技术细节和训练方法,为全球研究者赋能。德国马克斯·普朗克光科学研究所的马里奥·克伦也认为,DeepSeek-R1的开源性非常出色,相比之下,o1和其他模型都是闭源模型“黑匣子”。
被誉为“深度学习三巨头”之一的法国计算机科学家杨立昆评论道,与其说中国AI正在追赶美国,不如说“开源模型正在超越闭源”。
“元”公司首席执行官扎克伯格在一档播客节目中坦言,DeepSeek技术非常先进,担心这个开源模型会被全世界广泛使用,影响到美国科技行业的领先地位。他表示,这是一场差距很小的竞争。
一些美国专家也指出,如果最好的开源技术来自中国,美国开发人员将在这些技术之上构建他们的系统,从长远来看,这可能会让中国成为研发AI的中心。近年来,除了DeepSeek之外,阿里巴巴、快手、字节跳动以及腾讯等公司也推出了各自的AI模型。
英国科技网站“生命科学”撰稿人本·特纳指出,美国限制向中企出口先进AI计算芯片,迫使DeepSeek-R1的研发者采用更智能、更有效的算法来弥补计算能力的不足。据报道,ChatGPT需要一万台英伟达的图像处理器处理训练数据,而DeepSeek仅用2000台图像处理器就取得了类似结果。
在华盛顿州工作的技术专家阿尔文·王·格雷林认为,DeepSeek的进展显示出美国的领先优势正在缩小,各国应该采取合作方式建设先进AI,而不是进行“军备竞赛”。尽管DeepSeek势头惊人,但其技术目前仍落后于OpenAI和谷歌,未来可能将面临更多的压力和挑战。
主题测试文章,只做测试使用。发布者:火星财经,转转请注明出处:https://www.sengcheng.com/article/15337.html