DeepSeek又有重大突破 开源大模型性能卓越

DeepSeek发布了新一代开源大模型DeepSeek-R1。该模型在数学、代码、自然语言推理等任务上的性能与美国OpenAI公司的最新o1大模型相当。根据数据,DeepSeek-R1在算法类代码场景(Codeforces)和知识类测试(GPQA、MMLU)中的得分略低于OpenAI o1,但在工程类代码场景(SWE-Bench Verified)、美国数学竞赛(AIME 2024, MATH)项目上表现更优。

DeepSeek又有重大突破

与之前发布的DeepSeek-V3相比,DeepSeek-R1在AIME 2024和Codeforces中的得分提升了近一倍,其他方面也有所提升。深度求索更新了用户协议,明确模型开源许可将使用标准的MIT许可,并允许用户利用模型输出训练其他模型。数据显示,在基于DeepSeek-R1进行“蒸馏”的6个小模型中,32B和70B模型在多项能力上对标了OpenAI的o1-mini。

DeepSeek又有重大突破 开源大模型性能卓越

深度求索表示,DeepSeek-R1后训练阶段大量使用了强化学习技术,在极少人工标注数据的情况下显著提升了模型推理能力,几乎跳过了监督微调步骤。这使得DeepSeek-R1能够自我优化,生成更符合人类偏好的内容。尽管强化学习需要大量反馈且计算成本高,但其优势在于不依赖高质量的人工标注数据。

DeepSeek又有重大突破 开源大模型性能卓越

值得注意的是,深度求索还开发了一个完全通过大规模强化学习替代监督微调的大模型DeepSeek-R1-Zero,但因存在一些问题未对外公开。工作人员发现,在自我学习过程中,DeepSeek-R1-Zero出现了复杂行为,如自我反思、评估先前步骤、自发寻找替代方案的情况,甚至有一次“尤里卡时刻”。这种现象表明模型学会了用拟人化的语气进行自我反思,并主动为问题分配更多时间重新思考。

尽管DeepSeek-R1-Zero展示出强大的推理能力,但也出现了一些语言混乱及可读性问题。为此,深度求索引入数千条高质量冷启动数据和多段强化学习来解决这些问题,最终推出了正式版的DeepSeek-R1。目前,DeepSeek-R1 API服务定价为每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元。

责任编辑:张佳鑫 0764

主题测试文章,只做测试使用。发布者:火星财经,转转请注明出处:https://www.sengcheng.com/article/7147.html

(0)
火星财经的头像火星财经
上一篇 2025年1月21日 下午10:25
下一篇 2025年1月21日 下午10:25

相关推荐

  • 国际乒联举办球员论坛 共商乒乓未来

    2月2日,国际乒联特别工作组与球员和利益相关方进行了广泛磋商,并举办了球员论坛。他们还与中国乒乓球协会举行了一次会议,并联系了马龙、陈梦和樊振东,了解他们的具体情况。 特别工作组的成立旨在解决球员的担忧,并积极收集乒乓球界所有主要利益相关者的反馈。工作组直接与球员、教练、会员协会、随行人员代表和制造商进行协商,确保在最终确定建议之前进行全面审查。国际乒联主席…

    2025年2月2日
    400
  • 《五福临门》五折叠CP 轻《五福临门》首播!

    尽管于正的个人口碑不佳,经常受到网友批评,但他制作的剧集确实有其独特之处。即将在芒果台接档《国色芳华》播出的古装喜剧《五福临门》就是一个例子。尽管该剧在开播前遭遇了一系列风波,甚至有网友扬言要卸载芒果APP,但它的热度依然不减。 《五福临门》之所以能在不利条件下保持高热度,部分原因在于它属于当下观众喜爱的轻喜剧类型。回顾近年来的爆款剧集,很多都加入了轻喜剧元…

    2025年1月27日
    1100
  • 女子吃半斤车厘子导致胃出血 闪电新闻报道引发关注

    女子吃半斤车厘子导致胃出血,当事人:胃疼得无法呼吸 被送进抢救室! 女子吃半斤车厘子导致胃出血 闪电新闻报道引发关注 责任编辑:卢其龙 CN070

    2025年1月24日
    1200
  • 航拍高速:返乡车流增多 拥堵20公里 春运车流激增导致

    1月18日至19日,京港澳高速湘粤交界处南往北方向出现严重堵车。画面显示,南往北方向车辆排成长龙,而对向车道则车辆稀少。有车主发布视频称,该路段堵车长度约20公里。据湖南高速集团消息,由于春运返乡过节车流量逐渐增加,京港澳高速从广东进入湖南时由双向8车道变为4车道导致拥堵。目前,郴州段多个收费站已采取管制措施,车辆只出不进,并建议途经车辆绕行。 责任编辑:张…

    2025年1月19日
    1400
  • 河南将实施粮食产能提升工程 打造高产示范区

    河南省政府宣布,到2025年将实施粮食产能提升工程,包括建设1500万亩小麦高产示范区、加快区域性农业综合服务中心建设和加强科技装备支撑等措施。作为中国主要的粮食产区,河南连续8年保持粮食总产量在1300亿斤以上,不仅满足了本省1亿人口的需求,每年还向其他地区调出原粮及制成品600亿斤。尤其是小麦产量占全国四分之一以上,在种植面积、单产和总产量方面均居全国首…

    2025年1月18日
    1300

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信