AMD火速“站台”DeepSeek AI新星震撼科技界

DeepSeek正成为AI领域崛起的新星,打破了国内大模型的原有格局。本周,DeepSeek发布了DeepSeek-R1,并同步开源了模型权重。DeepSeek-R1遵循MIT License,允许用户通过蒸馏技术借助R1训练其他模型。

AMD火速“站台”DeepSeek

DeepSeek-R1上线了API,对用户开放思维链输出,设置model=’deepseek-reasoner’即可调用。该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能与OpenAI o1正式版相当。同时,DeepSeek开源了两个660B模型,并通过DeepSeek-R1的输出蒸馏出六个小模型,其中32B和70B模型在多项能力上实现了对标OpenAI o1-mini的效果。

AMD火速“站台”DeepSeek AI新星震撼科技界

DeepSeek-R1 API服务定价为每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元。DeepSeek在美国科技界引起震动,不仅因为其性能与OpenAI的o1相当且完全开源,还以极低成本实现了这一突破。知名投资人马克·安德森表示,DeepSeek R1是他见过最令人惊叹和印象深刻的突破之一,作为开源项目,这是给世界的一份重要礼物。

AMD火速“站台”DeepSeek AI新星震撼科技界

Scale AI创始人亚历山大·王认为,过去十年美国可能一直在人工智能竞赛中领先于中国,但DeepSeek的发布可能会改变这一局面。DeepSeek-R1与GPT-4o和Claude 3.5 Sonnet相当,训练时计算量减少10倍。这表明在美国人休息时,中国人在工作,并以更便宜、更快、更强的产品迎头赶上。

AMD火速“站台”DeepSeek AI新星震撼科技界

DeepSeek的动作让Meta的生成式AI团队感到恐慌。Meta CEO扎克伯格宣布加速研发Llama 4,计划投资650亿美元扩建数据中心,并部署130万枚GPU,以确保2025年Meta AI成为全球领先模型。

AMD火速“站台”DeepSeek AI新星震撼科技界

DeepSeek创始人梁文锋迅速在AI圈内确立地位。梁文锋本硕均就读于浙江大学信息与电子工程学专业。2015年,他与校友共同创立幻方量化。2021年,幻方量化成为国内首家突破千亿规模的量化私募大厂,被称为国内量化私募“四大天王”之一。早年,幻方量化开始大规模布局AI算力,搭建起“萤火一号”集群。2021年,“萤火二号”落成,为DeepSeek提供了快速发展的基础。

AMD火速“站台”DeepSeek AI新星震撼科技界

DeepSeek团队在预训练方面贡献巨大,包括超强的训练稳定度、深入使用fb8混合精度、多词同时预测、隐空间多注意力头、MOE混合专家等,大大降低了训练成本。他们仅用600万美元就训练出了一个600B的大模型,被视作工程上的奇迹。

AMD火速“站台”DeepSeek AI新星震撼科技界

分析人士指出,DeepSeek用较低的成本训练出比肩OpenAI o1水平的模型R1,而且R1还开源,这意味着算法有很大的提升空间,不需要那么多GPU和算力。封锁芯片和搞算力壁垒的思路行不通,而依赖大量GPU堆砌效果的模式也受到挑战。DeepSeek的出现可能导致许多购买了数千块NVIDIA芯片的AI初创公司破产,从而导致大量NVIDIA GPU流入二手市场。此外,一些运营数据中心并出租NVIDIA GPU的初创公司也可能受到影响。

AMD火速“站台”DeepSeek AI新星震撼科技界

这可能刺激更多专用推理模型诞生,创业公司和个人App可能会大幅减少在OpenAI API上的支出,转向开源。评论人士称,DeepSeek整合搜索信息的能力强于某些现有模型,让人对英伟达股价产生怀疑。中美科技底层差距虽然大,但中国拥有巨大的人才红利,有超过6000万工程师,超过美德日韩印总和,这是继续发展的底气和希望。

责任编辑:张蕾

主题测试文章,只做测试使用。发布者:火星财经,转转请注明出处:https://www.sengcheng.com/article/12450.html

(0)
火星财经的头像火星财经
上一篇 2025年1月26日 下午9:25
下一篇 2025年1月26日 下午9:25

相关推荐

  • 能运输能“开路” 看机械狗如何在南极“上班”

    六足机器狗亮相南极 科考队将有“新助手” 近日,在南极中山站附近的冰盖地区,我国自主研发的六足机器狗,顺利完成了一系列科考测试,这也成为我国极地科考设备的创新尝试。短片中的机器狗在冰天雪地中行走,背上还背着一个箱子,但是不摔跤、不打滑,那么机器狗是如何保持稳定性呢?奥秘就在机器狗穿的一双特制的鞋子上。 为了应对南极的恶劣环境,研发人员为机器狗设计了一款特殊的…

    2025年1月25日
    1100
  • 机票跳水!春节前部分机票降价超7成

    最近,不少网友发现,自己在春运开始前买好机票,结果却在春节前降价了。 据报道,1月19日,有游客向记者反映,近日重新预订了一家三口春节期间从北京前往珠海的航班,同样的航班,相比半个月前预订时,平均每人少花了600余元。不仅是该航线,春节期间北京往返三亚等热门航线也呈现下降趋势,部分机票价格下降超千元。 据“航旅纵横”发布的数据,截至1月13日,2025年春节…

    2025年1月21日
    1300
  • DeepSeek再发布新模型 Janus-Pro显著提升多模态能力

    1月28日凌晨,人工智能社区Hugging Face上发布了开源多模态AI模型Janus-Pro。作为Janus的高级版本,Janus-Pro采用了优化的训练策略,扩展了训练数据,并且拥有更大的模型规模。这些改进让Janus-Pro在多模态理解和文本到图像的指令跟踪能力方面有了显著提升,同时也增强了文本到图像生成的稳定性。该系列包括7B和1.5B参数量的两个…

    2025年1月29日
    700
  • 机器人春晚扭秧歌 科技实力震撼展示

    这次春晚节目出现了“机器人扭秧歌”,让人耳目一新。国家在人工智能领域的发展确实迅速,但这种节目并不受所有人喜爱。有网友评论说:“谁说内娱没有齐舞”,这句话也挺有意思。 对于这个节目,有人觉得难以理解,但在听取了一些分析后发现,这个节目其实是为了展示我国的科技实力,并给外国观众带来震撼。 责任编辑:张蕾

    2025年1月29日
    600
  • 新年首艘汽车滚装船引航进江 海事部门保障运输畅通

    1月29日,大年初一,在浙江舟山海事部门的护航下,中国香港籍LNG船“CESI WENZHOU”(中能温州)轮顺利靠泊新奥舟山LNG接收站码头。这是舟山在农历蛇年迎来的首艘LNG船,确保了民众春节期间生产生活用气需求。 春节前,一股较强寒潮影响华东地区,居民生产生活用气量大幅上升。“CESI WENZHOU”轮本航次计划卸载16.58万立方液化天然气,可供舟…

    2025年2月1日
    500

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信