DeepSeek婉拒所有采访专注研发 引发OpenAI紧急应对

DeepSeek婉拒所有采访专注研发。DeepSeek的最新动作迫使OpenAI在深夜紧急上线o3-mini。近半个月来,中国的人工智能技术持续占据国内外媒体头条,影响力不断扩大。关于DeepSeek模型的训练数据、GPU使用量、团队构成及强化学习算法等细节成为关注焦点。

DeepSeek婉拒所有采访专注研发

SemiAnalysis的一篇深度报道从多个角度进行了推测,包括训练成本、对闭源模型利润的影响以及团队规模等。报道指出,DeepSeek并非简单的副业项目,其在GPU等硬件上的支出超过5亿美元。论文中提到的600万美元仅是预训练阶段的GPU成本,研发和硬件总拥有成本并未计算在内。DeepSeek拥有约5万块Hopper GPU,包括特供版H800和H20。公司大约有150名员工,并定期从北大、浙大等顶尖高校招募人才,优秀候选人年薪可达130万美元。

DeepSeek婉拒所有采访专注研发 引发OpenAI紧急应对

DeepSeek的一个关键创新是多头潜注意力机制(MLA),该机制显著降低了推理成本。此外,V3模型性能远超R1和o1,谷歌的Gemini 2.0 Flash Thinking与R1不相上下。随着V3和R1的发布,H100价格大幅上涨,这体现了杰文斯悖论的作用。

DeepSeek婉拒所有采访专注研发 引发OpenAI紧急应对

幻方量化作为DeepSeek的主要投资者,很早就看到了AI在金融领域之外的巨大潜力。他们在2021年购入了10,000块A100 GPU,这一决策后来被证明极具前瞻性。2023年5月,幻方决定分拆成立DeepSeek,以更专注地推进AI技术发展。目前两家公司在人力资源和计算资源方面保持密切合作。

DeepSeek婉拒所有采访专注研发 引发OpenAI紧急应对

DeepSeek专注于招募中国本土人才,强调实际能力和求知欲望。他们在北京大学和浙江大学等顶尖高校举办招聘活动,提供极具竞争力的薪酬待遇。现有员工约150人,公司保持快速扩张态势。

DeepSeek婉拒所有采访专注研发 引发OpenAI紧急应对

DeepSeek的定价策略和运营效率引发了广泛关注。尽管预训练阶段的成本仅为600万美元,但整体投入远不止于此。开发新架构的过程中需要大量资源进行测试和验证。例如,多头潜注意力机制的开发周期长达数月,消耗了大量人力和计算资源。

DeepSeek婉拒所有采访专注研发 引发OpenAI紧急应对

V3模型的性能提升显著,但在AI快速迭代的背景下,半年前的技术已显得陈旧。随着时间推移,用更少的计算资源实现相当或更强的性能成为行业趋势。例如,现在可以在普通笔记本电脑上运行的小型模型能达到与GPT-3相当的性能水平,而后者在发布时需要超级计算机进行训练。

DeepSeek婉拒所有采访专注研发 引发OpenAI紧急应对

DeepSeek的独特之处在于他们率先实现了成本和性能的突破。虽然开源模型权重的做法已有先例,但DeepSeek的成就仍然显著。预计到今年年底,相关成本可能还会进一步下降5倍左右。

DeepSeek婉拒所有采访专注研发 引发OpenAI紧急应对

R1能够达到与o1相当的性能水平,关键在于新的“推理”范式。这种范式通过合成数据生成和后训练强化学习提升推理能力,使得以更低成本获得快速进展成为可能。然而,R1在许多场景下表现不如o1。OpenAI最近发布的o3测试结果显示,其性能提升几乎呈垂直上升趋势。

DeepSeek婉拒所有采访专注研发 引发OpenAI紧急应对

谷歌推出的Gemini Flash 2.0 Thinking在基准测试中表现优于R1,具有很强的稳定性。尽管如此,DeepSeek凭借快速行动、充足资金、卓越智慧和明确目标,在竞争中超越了Meta等科技巨头。

DeepSeek婉拒所有采访专注研发 引发OpenAI紧急应对

DeepSeek的多Token预测技术和混合专家模型架构显著提高了训练和推理效率。这些创新引起了西方实验室的关注。RL在R1中的应用也起到了重要作用,使其在格式化和安全性方面表现出色。通过合成数据集微调,R1的推理能力得以自然涌现。

DeepSeek婉拒所有采访专注研发 引发OpenAI紧急应对

MLA技术显著降低了DeepSeek模型的推理成本,减少了每次查询所需的KV缓存量,从而降低运营成本。由于H20芯片的高内存带宽和容量,DeepSeek在推理工作负载方面获得了更多效率提升。

R1并未真正动摇o1的技术优势,而是以更低的成本实现了相似的性能。这种现象符合市场逻辑,类似于半导体制造业的发展模式。率先突破新能力层次的公司将获得显著的价格溢价,而追赶者只能获得适度利润。DeepSeek通过零利润率策略打破了OpenAI的高利润率格局,但这是否可持续仍存疑。未来,计算资源的集中度将变得更加重要。

责任编辑:卢其龙 CN070

主题测试文章,只做测试使用。发布者:火星财经,转转请注明出处:https://www.sengcheng.com/article/20603.html

(0)
火星财经的头像火星财经
上一篇 2025年2月5日 下午3:26
下一篇 2025年2月5日 下午3:51

相关推荐

  • 杨丽萍揭秘蛇舞 致敬祖先文明

    1月26日晚,舞蹈家杨丽萍发布了新作品《蛇来运转》。她提到今年是生肖蛇年,在民间也被称为“小龙”。尽管自己曾怕蛇,但她早在80年代就创作过蛇舞。这次的创作灵感来源于祖先智慧,特别是人首蛇身的伏羲女娲图,其中还蕴含着人类DNA的秘密。通过舞蹈向祖先文明致敬。 在“蛇舞”视频中,舞蹈演员们化身为色彩斑斓的蛇,身上布满鳞片,扭动身躯摆出令人惊叹的动作。除了逼真的身…

    2025年1月28日
    1300
  • 哪吒2破64亿 春节档票房冠军

    哪吒2破64亿。根据猫眼专业版数据,电影《哪吒之魔童闹海》上映10天,总票房突破64亿。2019年上映的《哪吒之魔童降世》累计票房达到50.35亿,曾是中国影史暑期档动画片票房冠军。而《哪吒之魔童闹海》目前的票房已超过64亿,成为中国影史票房第一。 该片由饺子导演,于2025年1月29日上映,在春节档期间(1月29日至2月4日)斩获了48.39亿元票房,成为…

    2025年2月8日
    1300
  • 沈春阳回应邪恶车厘子梗 希望大家欢乐多多

    近日,许多网友重温电视剧《樱桃》后表示“以前同情樱桃,现在共鸣红红”,并将沈春阳饰演的角色“樱桃”称为“邪恶车厘子”。网友们在沈春阳和小沈阳的账号评论区纷纷玩梗,一时之间,“邪恶车厘子”的话题热度飙升。21日,沈春阳发布视频回应网友玩梗,表示开心就好,并希望大家能从樱桃这个角色中获得更多欢乐。她还提到,看完整部剧后会发现樱桃并不是邪恶的。 电视剧《樱桃》讲述…

    2025年1月22日
    1800
  • 为省一万二手术费!26岁程序员小伙尿出9毫米肾结石 网友:是个狠人

    小孙今年26岁,山东人,在上海做程序员,业余爱好是钓鱼。2024年10月24日小孙感觉腰部剧痛,去医院诊断后得知,双肾有结石,其中左肾结石卡在了输尿管入口。小孙听医生建议并拿了药后,坚持每天喝水5升以上,慢跑5公里,历时三个月后,在大年初五“尿”出了9毫米左右的结石。去医院做激光碎石需要一万两千元,且对手术治疗也十分恐惧,就下决心靠喝水排出结石。 责任编辑:…

    2025年2月7日
    1600
  • 特斯拉自研4680电池助赛博皮卡增产 年产量目标超12万

    特斯拉在其2024年第四季度更新信中透露,公司自研的4680电池生产线已达到每周生产超过2500辆Cybertruck的水平。这意味着特斯拉有望实现每年生产12万至13万辆Cybertruck的目标。 特斯拉表示,自研4680电池生产线已达到每周支持超过2500辆Cybertruck的生产速度。基于这一数据,特斯拉在2024年第四季度的生产能力足以支持每年生…

    2025年2月3日
    1700

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信