这个春节,最火爆的话题不是旅游与消费,而是DeepSeek与人工智能。从美国总统特朗普到全球所有AI公司,再到数十亿关注AI进展的用户,在最近十余天内都在讨论和研究DeepSeek。
1月20日,杭州深度求索人工智能基础技术研究有限公司发布了DeepSeek-R1,短短十余天内,这一事件在全球范围内迅速引发关注热潮,成为AI发展历史上的现象级事件之一。截至1月27日,DeepSeek在苹果App Store中国和美国区免费榜上均排名第一,超过了来自OpenAI的ChatGPT。
除了大量正面评价外,最值得关注的评论来自特朗普和OpenAI首席执行官萨姆·奥尔特曼。特朗普认为,中国的DeepSeek公司提出了一种更快、更便宜的人工智能方法,并认为这对美国行业是一个警钟。奥尔特曼则表示,DeepSeek-R1令人印象深刻,尤其是其价格优势,新竞争对手的出现令人振奋。
DeepSeek的爆火引发了关于AI领域的一些深层次问题。例如,它能否从“网红”转变为“长红”?当DeepSeek已经用低价策略走出一条独特道路后,AI大模型是否会继续走昂贵之路?AI大模型到底要走开源还是闭源之路?如何看待DeepSeek之后的中美AI技术水平差距?
近几天的表现反映出,DeepSeek并非只是一个简单的网红AI产品。其成功原因包括开发背景、性价比和发展路径。DeepSeek出自中国一家初创公司,而不是知名的互联网大厂或AI企业,这使其被称为“来自东方的神秘力量”。此外,DeepSeek能力强且价格低廉,水平堪比OpenAI相关产品但价格仅为后者的几分之一。DeepSeek还通过低成本、低算力需求打破了AI大模型研发的高价神话,并采取了完全开源的技术路线。
自2023年7月成立以来,DeepSeek已有过两次高光时刻。第一次是在筹备成立期间,当时媒体报道称该公司可能拥有超过1万枚英伟达GPU。第二次是在2024年5月,DeepSeek宣布对大模型大幅降价,掀起“价格战”,降幅甚至达到行业水平的9成以上。
此次DeepSeek发布的R1模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。可以预见,DeepSeek将成为中国AI领域的“新贵”,估值有望超过“六小虎”水平。然而,DeepSeek面临的国内外竞争也将更加激烈。
从技术上看,DeepSeek-R1的水平与OpenAI o1相当,但考虑到OpenAI仍在持续改进,DeepSeek能否长期保持较高技术水平尚未可知。国外竞争形势方面,DeepSeek对美国AI行业的刺激很大,未来美国AI行业可能会更加进取。特朗普宣布了一项名为“星际之门”的人工智能项目,将由美国甲骨文公司、OpenAI和日本软银集团联合出资5000亿美元打造。此外,Meta也宣布将在2025年投资高达650亿美元用于人工智能相关项目。
在国内,各互联网大厂和AI公司也会调整战略和技术路线进行新的竞争。同时,国内外资本对DeepSeek表现出浓厚兴趣,这考验着DeepSeek掌舵人的智慧。全球AI发展形势变化迅速,对于DeepSeek来说,未来的挑战是如何保持快速进步。
AI大模型的研发成本高昂,主要体现在算力和算法上。然而,DeepSeek仅用560万美元就训练出了技术水平堪比全球顶级的AI大模型,并实现了极低的用户收费。尽管如此,认为DeepSeek终结了AI大模型研发的昂贵路线可能为时尚早。现阶段的DeepSeek R1只是AI大模型的一个分支,低成本之路仍需全行业验证。此外,实现AGI的目标是否昂贵也未确定。
开源与闭源之争也是AI大模型领域的重要议题。DeepSeek坚定支持开源路线,任何人均可自行下载与部署,并提供了详细的训练步骤说明。DeepSeek的成功增加了开源模型的竞争力,但也引发了新的争议。闭源模式可以让企业更有动力投入并利用技术领先获得市场地位,而开源意味着技术共享,市场收益一般较小。
DeepSeek的爆火引发了关于中美AI技术水平差距的讨论。尽管DeepSeek在某些方面取得了重要突破,但整体上中国AI领域尤其AI大模型领域与美国仍有差距。算法、算力和数据方面的差距依然存在,市场表现也显示出较大差异。尽管如此,DeepSeek确实进一步缩短了中美AI的技术差距,具体缩短了多少还需后续观察。
主题测试文章,只做测试使用。发布者:火星财经,转转请注明出处:https://www.sengcheng.com/article/16168.html