吴恩达在其个人社交媒体上对DeepSeek发表评论。他是斯坦福大学计算机科学系和电子工程系副教授,人工智能实验室主任,也是在线教育平台Coursera联合创始人及DeepLearning.AI创始人。
本周,中国AI公司DeepSeek的崛起引起了广泛关注。吴恩达认为这反映出几个重要的行业趋势:
中国在生成式AI领域正在赶超美国,这将对AI供应链产生深远影响。开源权重模型正在将基础模型层商品化,为应用开发者创造了巨大的机遇。规模化并非AI进步的唯一道路,尽管算力备受瞩目和炒作,但算法创新正在迅速降低训练成本。
大约一周前,总部位于中国的DeepSeek发布了DeepSeek-R1模型,其基准测试性能可与OpenAI的o1模型相媲美,并以宽松的MIT许可证开源发布。上周的达沃斯论坛上,许多非技术出身的商业领袖向吴恩达提出了关于DeepSeek的问题。周一,股市出现了“DeepSeek抛售”现象:英伟达和其他美国科技公司的股价大幅下跌,部分股价随后有所回升。
吴恩达指出,许多人意识到中国在生成式AI领域正在赶超美国。虽然ChatGPT在2022年11月发布时,美国在生成式AI领域明显领先于中国,但过去两年里,这种差距迅速缩小。凭借Qwen、Kimi、InternVL和DeepSeek等来自中国的模型,中国显然一直在缩小差距,并且在视频生成等领域已处于领先地位。
吴恩达很高兴看到DeepSeek-R1以开源权重模型发布,并附带技术报告,分享了许多细节。与此形成鲜明对比的是,一些美国公司为了扼杀开源,大肆炒作诸如人类灭绝等假设性的AI危险,推动监管。如果美国继续阻碍开源,中国将主导AI供应链的关键环节,许多企业最终将使用更多反映中国价值观而非美国价值观的模型。
开源权重模型正在将基础模型层商品化。LLM的token价格一直在快速下降,开源权重模型加速了这一趋势,并为开发者提供了更多选择。例如,OpenAI的o1模型每百万输出token的成本为60美元,而DeepSeek R1的成本仅为2.19美元,近30倍的差异让更多人关注到了价格下降的趋势。
相比之下,在基础模型之上构建应用则蕴藏着巨大的商业机遇。现在,其他人已经花费数十亿美元训练了这些模型,只需少量资金就可以访问这些模型,以构建客户服务聊天机器人、邮件摘要器、AI医生、法律文件助手等。
围绕模型规模化的炒作由来已久,似乎规模化是推动进步的唯一途径。公平地说,吴恩达曾经也是模型规模化的早期倡导者。许多公司通过围绕这样一个叙事制造热点,从而筹集了数十亿美元。然而,人们过度关注规模化,忽视了更细致的观点,即可以通过多种不同的方式取得进步。
部分受到美国AI芯片禁运的影响,DeepSeek团队不得不进行许多优化,以便在性能较弱的H800 GPU而不是H100 GPU上运行,最终训练出了一个计算成本低于600万美元的模型。这是否真的会减少对算力的需求还有待观察。有时,降低商品单价反而会导致更多资金用于购买该商品。长期来看,对智能和算力的需求实际上没有上限,因此仍然看好人类会使用更多智能,即使它的成本变得更低。
在X上,吴恩达看到了许多对DeepSeek进展的不同解读,仿佛这是一场罗夏墨迹测验,每个人都将自己的意义投射到其中。他认为DeepSeek-R1具有尚未完全显现的地缘政治影响,同时这对AI应用开发者来说也是一件好事。他的团队已经开始集思广益,构思只有在能够轻松访问先进的开源推理模型后才成为可能的新想法。现在仍然是构建AI应用的绝佳时代。
主题测试文章,只做测试使用。发布者:火星财经,转转请注明出处:https://www.sengcheng.com/article/16732.html