DeepSeek开源周收官,颠覆存储架构!OpenAI继续“大力出奇迹”,GPT-4.5 价格达R1的270倍

谁能想到DeepSeek为了搞大模型自己弄了套文件系统?

2月28日,DeepSeek开源周的最后一天,DeepSeek直接公开了V3和R1训练推理过程中用到的Fire-Flyer文件系统(简称3FS,第三个F代表File)和基于3FS和DuckDB构建的轻量级数据处理框架Smallpond。

图片来源:X

3FS是一个真正意义上面向现代SSD(固态硬盘)和RDMA(远程直接访问)网络的文件系统,它可以把固态硬盘的带宽性能利用到极致,并表现出了惊人的速度:180节点集群中的聚合读取吞吐量为6.6TiB/s;25节点集群中GraySort基准测试的吞吐量为3.66TiB/分钟;每个客户端节点的KVCache查找峰值吞吐量超过40GiB/s。

KCORES联合创始人karminski-牙医评价道:“DeepSeek颠覆了存储架构。”

图片来源:X

根据DeepSeek团队介绍,3FS就是为了AI训练和推理工作负载的挑战所开发的。它利用现代SSD和RDMA网络来提供共享存储层,从而简化分布式应用程序的开发。

它可以在没有双方操作系统介入的情况下,将数据直接从一台计算机的内存传输到另一台计算机,也不需要中央处理器、CPU缓存或上下文交换参与。特点就是高通量、低延迟,尤其适合在大规模并行计算机集群中使用。

那这样方便的系统,有什么作用呢?每经小编请DeepSeek大模型用白话来解答这一问题。

而在DeepSeek开源3FS文件系统前几个小时,OpenAI推出了期待已久的GPT-4.5,之前这个模型的代号为“Orion”。OpenAI声称这是其迄今最大、知识最丰富的模型,现已向每月订阅费用达200美元的ChatGPT Pro用户开放。

OpenAI首席执行官阿尔特曼表示,新模型的运行成本太高了,下周OpenAI将增加数万块GPU,提供算力支撑。

在马斯克旗下xAI的Grok 3发布时,大家都兴奋地表示,Scaling Law(规模法则)还没有撞墙。但GPT-4.5一出,外界发现,OpenAI“撞墙”了。

GPT-4.5的预训练计算量是GPT-4的10倍,但是基准测试只比4o好5%。在AIME和GPQA等困难的学术基准测试中,GPT-4.5的表现也达不到o3-mini、DeepSeek-R1和Claude 3.7 Sonnet等领先AI推理模型的水平。

图片来源:X

阿尔特曼都只能解释道,虽然它又贵,又慢,又不够好。但是它有人情味儿。

有博主测评后表示,GPT-4.5这情商高得直接把智商干没了。

图片来源:数字生命卡兹克

而GPT-4.5的价格也是高到离谱,每百万Tokens输出价格150美元(约合人民币1093.5元),是其他模型的10~100倍,更别说和DeepSeek比了。

2月26日,DeepSeek宣布了错峰价格制度,DeepSeek-R1在高峰期每百万Tokens输出价格为2.19美元(约合人民币15.9元),低谷期的价格仅为0.55美元 (约合人民币4元)。以低谷期的价格计算,GPT-4.5的价格是DeepSeek-R1的近270倍。

图片来源:X

DeepSeek为何能做出成本高效的AI模型呢?从这周开源的五大项目就能看出来,DeepSeek主打的就是“榨干”硬件性能。

第一天:FlashMLA架构,直接“爆改”英伟达GPU,突破H800计算上限;

第二天:DeepEP,第一个用于MoE(混合专家)模型训练和推理的开源EP(专家并行)通信库,提供高吞吐量和低延迟的all-to-all GPU内核;

第三天:DeepGEMM,仅300行代码的通用矩阵乘法库;

第四天:连开三源,创新的双向流水线并行算法DualPipe、用于MoE的负载均衡算法EPLB,以及训练和推理框架的性能分析数据;

第五天:3FS和Smallpond,高效的分布式文件系统和以之为基础的数据处理框架压榨固态硬盘性能。

在DeepSeek的数弹连发后,有网友称,DeepSeek成领头羊了。

图片来源:X

那让我们来看看,DeepSeek是怎么评价GPT-4.5这一模型的吧。

所以说,与其用OpenAI的天价模型,真不如使用DeepSeek更高效的R1模型。但老是“服务器繁忙,请稍后再试”,怎么办?

不用担心,2月12日每日经济新闻App和每经网全面接入DeepSeek、Kimi、豆包、智谱清言、文心一言和通义千问6款大模型。用户通过每日经济新闻App和每经网就能与大模型自由对话还能一键“问公司”“问投资”“问基金”。

不得不说,用起来真的很丝滑,目前使用量已经超15万次了!

咋用呢?超简单!

下载每日经济新闻App

https://www.nbd.com.cn/corp/2016app/index.html

再往下看

一、 在每日经济新闻App首页,点击“DeepSeek”图标或首页轮播图“自由问+问公司问投资问基金免费使用DeepSeek、Kimi、豆包等六款大模型”。

二、 进入“每经大模型平台”页面,即可使用DeepSeek、Kimi、豆包、智谱清言、文心一言和通义千问6款大模型中任意一款。

最近,每经“136计划”还增加了新功能:

大模型解读投资热榜。

只需点击投资热榜中的任意新闻。

立即就能得到大模型的全面分析。

还能一键生成图片分享给朋友

告别“服务器繁忙”

快用每日经济新闻App吧!

主题测试文章,只做测试使用。发布者:火星财经,转转请注明出处:https://www.sengcheng.com/article/35588.html

(0)
火星财经的头像火星财经
上一篇 2025年3月1日 下午2:59
下一篇 2025年3月1日 下午3:00

相关推荐

  • 杭钢股份连收7个涨停板 搭上DeepSeek概念车

    杭钢股份连收7个涨停板。杭钢股份近期股价连续涨停,截至2月13日已收获7个涨停板,股价从5.20元/股上涨至10.13元/股。尽管杭钢股份预计2024年将出现亏损,但其股价依然不断上升。 杭钢股份是杭州钢铁集团的控股子公司,主营业务为钢铁及其压延产品的生产和销售。由于行业需求下降、产能过剩以及美国对进口钢铝加征关税等因素影响,多数钢铁企业面临业绩下滑或亏损的…

    2025年2月13日
    1900
  • 2025内蒙古省考公告已出 招考6553人

    2025内蒙古省考公告已出。2025年内蒙古省考公告已经发布,计划招录6553人。报名时间为2月21日至25日,准考证打印时间为3月10日至16日。笔试安排如下:3月15日上午9:00至11:00进行《行测职业能力测试》,下午14:00至17:00进行《申论》考试;3月16日上午9:00至11:00进行《公安专业知识笔试》。 责任编辑:卢其龙 CN070

    2025年1月23日
    2900
  • 美宣布对中国商品加征10%关税 引发广泛反对

    美国总统特朗普签署了一项行政令,对所有从中国进口的商品加征10%的关税。这一贸易保护措施在国际社会和美国国内引起了广泛反对。白宫表示,此举与特朗普支持的“保护主义措施”一致。 中国外交部发言人曾多次表明立场,认为贸易战和关税战没有赢家,并强调中方始终坚定维护国家利益。中国商务部发言人也指出,中方在关税问题上的立场是一贯的,认为关税措施不仅不利于中美双方,也不…

    2025年2月2日
    2300
  • “破案”了!“巳升升”的诞生,出自北京这所高校!传统文化与现代审美巧妙融合

    今年春节联欢晚会上,吉祥物“巳升升”频繁亮相,赢得了观众的喜爱。这个以青绿色为主调的小蛇形象象征着春意盎然和蓬勃生机,其外形憨态可掬,设计灵感来源于甲骨文中的“巳”字,寓意丰富。 “巳升升”的设计出自北京师范大学未来设计学院院长高鹏教授带领的团队之手。他们希望通过独特的创意和设计展现中华文化的奥妙,让这只小蛇既契合春晚“巳巳如意,生生不息”的主题,又能为14…

    2025年2月7日
    2100
  • 山东一企业要求员工限期结婚 规定被叫停引发热议

    近日,山东省临沂市沂南县的山东舜天化工集团工会发布了一则通知,要求28岁至58岁的单身员工在今年9月30日前成家立业,否则需检讨并离职。这一消息引发了网友的关注。随后,沂南县人社局介入调查,并下达了责令改正指令书,撤销并废止了该通知中的规定。 公司相关负责人表示,初衷是帮助和督促大龄未婚职工拿出时间和精力解决个人问题,但方法过于简单,将倡议变成了硬性规定。对…

    2025年2月15日
    1800

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信