DeepSeek婉拒所有采访专注研发引发OpenAI紧急应对

火星财经 • 2025年2月5日下午3:26 • 社会 • 阅读 10

DeepSeek婉拒所有采访专注研发。DeepSeek的最新动作迫使OpenAI在深夜紧急上线o3-mini。近半个月来，中国的人工智能技术持续占据国内外媒体头条，影响力不断扩大。关于DeepSeek模型的训练数据、GPU使用量、团队构成及强化学习算法等细节成为关注焦点。

DeepSeek婉拒所有采访专注研发

SemiAnalysis的一篇深度报道从多个角度进行了推测，包括训练成本、对闭源模型利润的影响以及团队规模等。报道指出，DeepSeek并非简单的副业项目，其在GPU等硬件上的支出超过5亿美元。论文中提到的600万美元仅是预训练阶段的GPU成本，研发和硬件总拥有成本并未计算在内。DeepSeek拥有约5万块Hopper GPU，包括特供版H800和H20。公司大约有150名员工，并定期从北大、浙大等顶尖高校招募人才，优秀候选人年薪可达130万美元。

DeepSeek婉拒所有采访专注研发引发OpenAI紧急应对

DeepSeek的一个关键创新是多头潜注意力机制（MLA），该机制显著降低了推理成本。此外，V3模型性能远超R1和o1，谷歌的Gemini 2.0 Flash Thinking与R1不相上下。随着V3和R1的发布，H100价格大幅上涨，这体现了杰文斯悖论的作用。

DeepSeek婉拒所有采访专注研发引发OpenAI紧急应对

幻方量化作为DeepSeek的主要投资者，很早就看到了AI在金融领域之外的巨大潜力。他们在2021年购入了10,000块A100 GPU，这一决策后来被证明极具前瞻性。2023年5月，幻方决定分拆成立DeepSeek，以更专注地推进AI技术发展。目前两家公司在人力资源和计算资源方面保持密切合作。

DeepSeek婉拒所有采访专注研发引发OpenAI紧急应对

DeepSeek专注于招募中国本土人才，强调实际能力和求知欲望。他们在北京大学和浙江大学等顶尖高校举办招聘活动，提供极具竞争力的薪酬待遇。现有员工约150人，公司保持快速扩张态势。

DeepSeek婉拒所有采访专注研发引发OpenAI紧急应对

DeepSeek的定价策略和运营效率引发了广泛关注。尽管预训练阶段的成本仅为600万美元，但整体投入远不止于此。开发新架构的过程中需要大量资源进行测试和验证。例如，多头潜注意力机制的开发周期长达数月，消耗了大量人力和计算资源。

DeepSeek婉拒所有采访专注研发引发OpenAI紧急应对

V3模型的性能提升显著，但在AI快速迭代的背景下，半年前的技术已显得陈旧。随着时间推移，用更少的计算资源实现相当或更强的性能成为行业趋势。例如，现在可以在普通笔记本电脑上运行的小型模型能达到与GPT-3相当的性能水平，而后者在发布时需要超级计算机进行训练。

DeepSeek婉拒所有采访专注研发引发OpenAI紧急应对

DeepSeek的独特之处在于他们率先实现了成本和性能的突破。虽然开源模型权重的做法已有先例，但DeepSeek的成就仍然显著。预计到今年年底，相关成本可能还会进一步下降5倍左右。

DeepSeek婉拒所有采访专注研发引发OpenAI紧急应对

R1能够达到与o1相当的性能水平，关键在于新的“推理”范式。这种范式通过合成数据生成和后训练强化学习提升推理能力，使得以更低成本获得快速进展成为可能。然而，R1在许多场景下表现不如o1。OpenAI最近发布的o3测试结果显示，其性能提升几乎呈垂直上升趋势。

DeepSeek婉拒所有采访专注研发引发OpenAI紧急应对

谷歌推出的Gemini Flash 2.0 Thinking在基准测试中表现优于R1，具有很强的稳定性。尽管如此，DeepSeek凭借快速行动、充足资金、卓越智慧和明确目标，在竞争中超越了Meta等科技巨头。

DeepSeek婉拒所有采访专注研发引发OpenAI紧急应对

DeepSeek的多Token预测技术和混合专家模型架构显著提高了训练和推理效率。这些创新引起了西方实验室的关注。RL在R1中的应用也起到了重要作用，使其在格式化和安全性方面表现出色。通过合成数据集微调，R1的推理能力得以自然涌现。

DeepSeek婉拒所有采访专注研发引发OpenAI紧急应对

MLA技术显著降低了DeepSeek模型的推理成本，减少了每次查询所需的KV缓存量，从而降低运营成本。由于H20芯片的高内存带宽和容量，DeepSeek在推理工作负载方面获得了更多效率提升。

R1并未真正动摇o1的技术优势，而是以更低的成本实现了相似的性能。这种现象符合市场逻辑，类似于半导体制造业的发展模式。率先突破新能力层次的公司将获得显著的价格溢价，而追赶者只能获得适度利润。DeepSeek通过零利润率策略打破了OpenAI的高利润率格局，但这是否可持续仍存疑。未来，计算资源的集中度将变得更加重要。

责任编辑：卢其龙 CN070

主题测试文章，只做测试使用。发布者：火星财经，转转请注明出处：https://www.sengcheng.com/article/20603.html

赞 (0)

0 0

申京空砍24分20板火箭惜败篮网吞四连败

上一篇 2025年2月5日下午3:26

长安糯玉米大年初二老家自燃烧成壳车主：不是被烟花点的

下一篇 2025年2月5日下午3:51

社会

杨丽萍揭秘蛇舞致敬祖先文明

1月26日晚，舞蹈家杨丽萍发布了新作品《蛇来运转》。她提到今年是生肖蛇年，在民间也被称为“小龙”。尽管自己曾怕蛇，但她早在80年代就创作过蛇舞。这次的创作灵感来源于祖先智慧，特别是人首蛇身的伏羲女娲图，其中还蕴含着人类DNA的秘密。通过舞蹈向祖先文明致敬。在“蛇舞”视频中，舞蹈演员们化身为色彩斑斓的蛇，身上布满鳞片，扭动身躯摆出令人惊叹的动作。除了逼真的身…

火星财经
2025年1月28日
13000
社会

哪吒2破64亿春节档票房冠军

哪吒2破64亿。根据猫眼专业版数据，电影《哪吒之魔童闹海》上映10天，总票房突破64亿。2019年上映的《哪吒之魔童降世》累计票房达到50.35亿，曾是中国影史暑期档动画片票房冠军。而《哪吒之魔童闹海》目前的票房已超过64亿，成为中国影史票房第一。该片由饺子导演，于2025年1月29日上映，在春节档期间（1月29日至2月4日）斩获了48.39亿元票房，成为…

火星财经
2025年2月8日
13000
社会

沈春阳回应邪恶车厘子梗希望大家欢乐多多

近日，许多网友重温电视剧《樱桃》后表示“以前同情樱桃，现在共鸣红红”，并将沈春阳饰演的角色“樱桃”称为“邪恶车厘子”。网友们在沈春阳和小沈阳的账号评论区纷纷玩梗，一时之间，“邪恶车厘子”的话题热度飙升。21日，沈春阳发布视频回应网友玩梗，表示开心就好，并希望大家能从樱桃这个角色中获得更多欢乐。她还提到，看完整部剧后会发现樱桃并不是邪恶的。电视剧《樱桃》讲述…

火星财经
2025年1月22日
18000
社会

为省一万二手术费！26岁程序员小伙尿出9毫米肾结石网友：是个狠人

小孙今年26岁，山东人，在上海做程序员，业余爱好是钓鱼。2024年10月24日小孙感觉腰部剧痛，去医院诊断后得知，双肾有结石，其中左肾结石卡在了输尿管入口。小孙听医生建议并拿了药后，坚持每天喝水5升以上，慢跑5公里，历时三个月后，在大年初五“尿”出了9毫米左右的结石。去医院做激光碎石需要一万两千元，且对手术治疗也十分恐惧，就下决心靠喝水排出结石。责任编辑：…

火星财经
2025年2月7日
16000
社会

特斯拉自研4680电池助赛博皮卡增产年产量目标超12万

特斯拉在其2024年第四季度更新信中透露，公司自研的4680电池生产线已达到每周生产超过2500辆Cybertruck的水平。这意味着特斯拉有望实现每年生产12万至13万辆Cybertruck的目标。特斯拉表示，自研4680电池生产线已达到每周支持超过2500辆Cybertruck的生产速度。基于这一数据，特斯拉在2024年第四季度的生产能力足以支持每年生…

火星财经
2025年2月3日
17000

发表回复

联系我们

400-800-8888

在线咨询： QQ交谈

邮件：admin@example.com

工作时间：周一至周五，9:30-18:30，节假日休息

关注微信