AMD火速“站台”DeepSeek AI新星震撼科技界

DeepSeek正成为AI领域崛起的新星,打破了国内大模型的原有格局。本周,DeepSeek发布了DeepSeek-R1,并同步开源了模型权重。DeepSeek-R1遵循MIT License,允许用户通过蒸馏技术借助R1训练其他模型。

AMD火速“站台”DeepSeek

DeepSeek-R1上线了API,对用户开放思维链输出,设置model=’deepseek-reasoner’即可调用。该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能与OpenAI o1正式版相当。同时,DeepSeek开源了两个660B模型,并通过DeepSeek-R1的输出蒸馏出六个小模型,其中32B和70B模型在多项能力上实现了对标OpenAI o1-mini的效果。

AMD火速“站台”DeepSeek AI新星震撼科技界

DeepSeek-R1 API服务定价为每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元。DeepSeek在美国科技界引起震动,不仅因为其性能与OpenAI的o1相当且完全开源,还以极低成本实现了这一突破。知名投资人马克·安德森表示,DeepSeek R1是他见过最令人惊叹和印象深刻的突破之一,作为开源项目,这是给世界的一份重要礼物。

AMD火速“站台”DeepSeek AI新星震撼科技界

Scale AI创始人亚历山大·王认为,过去十年美国可能一直在人工智能竞赛中领先于中国,但DeepSeek的发布可能会改变这一局面。DeepSeek-R1与GPT-4o和Claude 3.5 Sonnet相当,训练时计算量减少10倍。这表明在美国人休息时,中国人在工作,并以更便宜、更快、更强的产品迎头赶上。

AMD火速“站台”DeepSeek AI新星震撼科技界

DeepSeek的动作让Meta的生成式AI团队感到恐慌。Meta CEO扎克伯格宣布加速研发Llama 4,计划投资650亿美元扩建数据中心,并部署130万枚GPU,以确保2025年Meta AI成为全球领先模型。

AMD火速“站台”DeepSeek AI新星震撼科技界

DeepSeek创始人梁文锋迅速在AI圈内确立地位。梁文锋本硕均就读于浙江大学信息与电子工程学专业。2015年,他与校友共同创立幻方量化。2021年,幻方量化成为国内首家突破千亿规模的量化私募大厂,被称为国内量化私募“四大天王”之一。早年,幻方量化开始大规模布局AI算力,搭建起“萤火一号”集群。2021年,“萤火二号”落成,为DeepSeek提供了快速发展的基础。

AMD火速“站台”DeepSeek AI新星震撼科技界

DeepSeek团队在预训练方面贡献巨大,包括超强的训练稳定度、深入使用fb8混合精度、多词同时预测、隐空间多注意力头、MOE混合专家等,大大降低了训练成本。他们仅用600万美元就训练出了一个600B的大模型,被视作工程上的奇迹。

AMD火速“站台”DeepSeek AI新星震撼科技界

分析人士指出,DeepSeek用较低的成本训练出比肩OpenAI o1水平的模型R1,而且R1还开源,这意味着算法有很大的提升空间,不需要那么多GPU和算力。封锁芯片和搞算力壁垒的思路行不通,而依赖大量GPU堆砌效果的模式也受到挑战。DeepSeek的出现可能导致许多购买了数千块NVIDIA芯片的AI初创公司破产,从而导致大量NVIDIA GPU流入二手市场。此外,一些运营数据中心并出租NVIDIA GPU的初创公司也可能受到影响。

AMD火速“站台”DeepSeek AI新星震撼科技界

这可能刺激更多专用推理模型诞生,创业公司和个人App可能会大幅减少在OpenAI API上的支出,转向开源。评论人士称,DeepSeek整合搜索信息的能力强于某些现有模型,让人对英伟达股价产生怀疑。中美科技底层差距虽然大,但中国拥有巨大的人才红利,有超过6000万工程师,超过美德日韩印总和,这是继续发展的底气和希望。

责任编辑:张蕾

文章来源于网络。发布者:火星财经,转载请注明出处:https://www.sengcheng.com/article/12450.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
火星财经的头像火星财经
上一篇 2025年1月26日 下午9:25
下一篇 2025年1月26日 下午9:25

相关推荐

  • 超2万吨车厘子跨越山海,“甜”满了什么?

    “2024年中国GDP同比增长5.0%”,1月17日,国家统计局在国新办发布会上公布的这一数据,引发关注。 梳理2024年主要经济数据,还有一个5%充满张力,即“全年货物进出口总额438468亿元,比上年增长5.0%”。 透视这个5%,可发现我国货物进出口较快增长,贸易结构持续优化。说到货物进出口,就在近日,载有超1000柜、总重超2万吨智利车厘子的国际货轮…

    2025年1月19日
    13400
  • 哪吒2敖丙和他爸要帅到一个底子上 敖光设计引热议

    1月31日,“敖丙他爸出场 哇声一片话题”登上微博热搜。敖丙角色设计师申威表示,在设计敖丙和敖光时,他们的帅气是基础要求。饺子导演提到,《哪吒2》的武戏与剧情紧密结合,力求展现新颖之处。敖光作为敖丙的父亲,被设定为水系冰系角色,拥有水刀、水龙等壮观特效。北海龙王敖顺性格阴险狡诈,身体关节灵活且布满刀片,打法非常规。南海龙王敖钦脾气火爆,属于火系,被设定为蛮横…

    2025年2月1日
    27000
  • 长沙各大博物馆迎长假开门红 文化活动丰富多彩

    在长沙,除了走亲访友和逛庙会集市,博物馆成了新春聚集的新风尚。正月初三,尽管长沙下着雨,但人们参观博物馆的热情未减。全天走访发现,各大博物馆均迎来“开门红”。 上午10时,长沙博物馆门前已排起长队,截至上午11时30分,已有7339人入场。下午16:30,长沙博物馆显示当天参观人数已达12129人。同一天,长沙简牍博物馆接待了9131名游客,贾谊故居则有24…

    2025年2月1日
    19600
  • 哪吒投资方光线传媒赢麻了 3天狂收20亿!

    8.6分的超高口碑,连续好几天逆跌,同期竞争的电影毫无还手之力…… 这样的票房盛景,大概只有19年的《哪吒1》时候才出现过了吧。 果然,能够战胜饺子的,只有导演饺子了。 毫无疑问,投资人赚得盆满钵满,那么《哪吒》火爆的背后,到底有哪些大赢家呢。 看看《哪吒2》的出品方。 第二部的主要出品公司有5家, 分别是可可可豆公司,光线传媒,彩条…

    2025年2月5日
    14800
  • 钓鱼巧克力大爷回应因黑走红,日钓8小时不涂防晒:网友称八级钓帝

    “今天是个钓鱼的好天气。”74 岁的安国勇像往常一样,把钓竿斜挎在肩上,骑上电动车,哼着小曲儿往村头小河去。每天雷打不动,早上 6 点到 10 点,下午 3 点到 6 点,他从不戴帽子,也不涂防晒霜。几十年下来,太阳把他的脸晒得黝黑发亮,脖子和手臂像裹了层巧克力酱,“晒掉一层皮,钓起一条鱼” 成了他的日常写照。这 “硬核” 的美黑成果,让他意外走红网络,网友…

    2025年10月19日
    23000

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信