DeepSeek上周发布了开源模型DeepSeek-R1,并声称其性能可以与OpenAI的o1正式版相媲美,这一消息在海外AI业界引发了广泛讨论。焦点在于,当开源模型的能力达到甚至超越最新的闭源模型时,可能会改变整个大模型的竞争格局。
根据DeepSeek的介绍,DeepSeek-R1在Codeforces、GPQA Diamond、MATH-500、MMLU、SWE-bench Verified等测试中的得分接近或超过o1正式版。该模型在后训练阶段大规模应用了强化学习技术,在仅有少量标注数据的情况下显著提升了推理能力。
Meta首席AI科学家Yann Lecun认为,DeepSeek-R1的发布意味着开源大模型正在超越闭源模型,而不是单纯地表明中国公司在AI领域超越美国公司。他表示,DeepSeek将从开放研究和开源中受益,类似于Meta的PyTorch和Llama。通过提出新想法并在他人工作的基础上进行实现,由于这些工作是公开和开源的,每个人都能从中获益,这就是开放研究和开源的力量。
主题测试文章,只做测试使用。发布者:火星财经,转转请注明出处:https://www.sengcheng.com/article/13578.html