DeepSeek开源周收官,颠覆存储架构!OpenAI继续“大力出奇迹”,GPT-4.5 价格达R1的270倍

谁能想到DeepSeek为了搞大模型自己弄了套文件系统?

2月28日,DeepSeek开源周的最后一天,DeepSeek直接公开了V3和R1训练推理过程中用到的Fire-Flyer文件系统(简称3FS,第三个F代表File)和基于3FS和DuckDB构建的轻量级数据处理框架Smallpond。

图片来源:X

3FS是一个真正意义上面向现代SSD(固态硬盘)和RDMA(远程直接访问)网络的文件系统,它可以把固态硬盘的带宽性能利用到极致,并表现出了惊人的速度:180节点集群中的聚合读取吞吐量为6.6TiB/s;25节点集群中GraySort基准测试的吞吐量为3.66TiB/分钟;每个客户端节点的KVCache查找峰值吞吐量超过40GiB/s。

KCORES联合创始人karminski-牙医评价道:“DeepSeek颠覆了存储架构。”

图片来源:X

根据DeepSeek团队介绍,3FS就是为了AI训练和推理工作负载的挑战所开发的。它利用现代SSD和RDMA网络来提供共享存储层,从而简化分布式应用程序的开发。

它可以在没有双方操作系统介入的情况下,将数据直接从一台计算机的内存传输到另一台计算机,也不需要中央处理器、CPU缓存或上下文交换参与。特点就是高通量、低延迟,尤其适合在大规模并行计算机集群中使用。

那这样方便的系统,有什么作用呢?每经小编请DeepSeek大模型用白话来解答这一问题。

而在DeepSeek开源3FS文件系统前几个小时,OpenAI推出了期待已久的GPT-4.5,之前这个模型的代号为“Orion”。OpenAI声称这是其迄今最大、知识最丰富的模型,现已向每月订阅费用达200美元的ChatGPT Pro用户开放。

OpenAI首席执行官阿尔特曼表示,新模型的运行成本太高了,下周OpenAI将增加数万块GPU,提供算力支撑。

在马斯克旗下xAI的Grok 3发布时,大家都兴奋地表示,Scaling Law(规模法则)还没有撞墙。但GPT-4.5一出,外界发现,OpenAI“撞墙”了。

GPT-4.5的预训练计算量是GPT-4的10倍,但是基准测试只比4o好5%。在AIME和GPQA等困难的学术基准测试中,GPT-4.5的表现也达不到o3-mini、DeepSeek-R1和Claude 3.7 Sonnet等领先AI推理模型的水平。

图片来源:X

阿尔特曼都只能解释道,虽然它又贵,又慢,又不够好。但是它有人情味儿。

有博主测评后表示,GPT-4.5这情商高得直接把智商干没了。

图片来源:数字生命卡兹克

而GPT-4.5的价格也是高到离谱,每百万Tokens输出价格150美元(约合人民币1093.5元),是其他模型的10~100倍,更别说和DeepSeek比了。

2月26日,DeepSeek宣布了错峰价格制度,DeepSeek-R1在高峰期每百万Tokens输出价格为2.19美元(约合人民币15.9元),低谷期的价格仅为0.55美元 (约合人民币4元)。以低谷期的价格计算,GPT-4.5的价格是DeepSeek-R1的近270倍。

图片来源:X

DeepSeek为何能做出成本高效的AI模型呢?从这周开源的五大项目就能看出来,DeepSeek主打的就是“榨干”硬件性能。

第一天:FlashMLA架构,直接“爆改”英伟达GPU,突破H800计算上限;

第二天:DeepEP,第一个用于MoE(混合专家)模型训练和推理的开源EP(专家并行)通信库,提供高吞吐量和低延迟的all-to-all GPU内核;

第三天:DeepGEMM,仅300行代码的通用矩阵乘法库;

第四天:连开三源,创新的双向流水线并行算法DualPipe、用于MoE的负载均衡算法EPLB,以及训练和推理框架的性能分析数据;

第五天:3FS和Smallpond,高效的分布式文件系统和以之为基础的数据处理框架压榨固态硬盘性能。

在DeepSeek的数弹连发后,有网友称,DeepSeek成领头羊了。

图片来源:X

那让我们来看看,DeepSeek是怎么评价GPT-4.5这一模型的吧。

所以说,与其用OpenAI的天价模型,真不如使用DeepSeek更高效的R1模型。但老是“服务器繁忙,请稍后再试”,怎么办?

不用担心,2月12日每日经济新闻App和每经网全面接入DeepSeek、Kimi、豆包、智谱清言、文心一言和通义千问6款大模型。用户通过每日经济新闻App和每经网就能与大模型自由对话还能一键“问公司”“问投资”“问基金”。

不得不说,用起来真的很丝滑,目前使用量已经超15万次了!

咋用呢?超简单!

下载每日经济新闻App

https://www.nbd.com.cn/corp/2016app/index.html

再往下看

一、 在每日经济新闻App首页,点击“DeepSeek”图标或首页轮播图“自由问+问公司问投资问基金免费使用DeepSeek、Kimi、豆包等六款大模型”。

二、 进入“每经大模型平台”页面,即可使用DeepSeek、Kimi、豆包、智谱清言、文心一言和通义千问6款大模型中任意一款。

最近,每经“136计划”还增加了新功能:

大模型解读投资热榜。

只需点击投资热榜中的任意新闻。

立即就能得到大模型的全面分析。

还能一键生成图片分享给朋友

告别“服务器繁忙”

快用每日经济新闻App吧!

文章来源于网络。发布者:火星财经,转载请注明出处:https://www.sengcheng.com/article/35588.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
火星财经的头像火星财经
上一篇 2025年3月1日 下午2:59
下一篇 2025年3月1日 下午3:00

相关推荐

  • A股午评:三大指数低开高走集体翻红,创业板指涨0.61%北证50涨6.88%,军工板块爆发!超2600股上涨,成交额1.12万亿放量786亿

      格隆汇4月9日|A股三大指数早盘低开高走,截至午盘,沪指涨0.24%报3152.96点,深成指涨0.56%,创业板指涨0.61%,北证50指数涨6.88%。全市场半日成交额11217亿元,较上日放量786亿元,超2600只个股上涨。   盘面上,农业种植板块继续活跃,秋乐种业30cm涨停,新赛股份(600540)4连板;军工板块爆发,中船防务(60068…

    2025年4月9日
    13500
  • 今天正月初五,俗语“破五不破冰,种啥啥不成” 探讨降雪的传统说法与应对策略

    在中国传统的农历年节里,正月初五是一个充满特殊意义的日子,被老百姓俗称为“破五节”。这天也是财神爷的生日,家家户户会举行迎财神的活动,希望新的一年财运亨通。同时,过了这一天,春节期间的各种禁忌便告一段落,人们可以重新开始一年的忙碌与奋斗。 “最怕正月初五雪”这句老话反映了人们对天气变化的敏感与关注。在农耕社会,天气状况直接影响农作物的生长与收成。因此,古人通…

    2025年2月2日
    14800
  • 雄安新区推出8天免费探亲房 助力人才扎根雄安

    2月1日,雄安新区宣布了一项暖心服务举措,中国雄安集团城市发展有限公司旗下的雄安安居保障房公司推出了“8天免费探亲房”,包括免房租、免水电、免服务费。这项服务旨在为雄安新区的疏解人员提供支持,吸引更多人才扎根于此,增强保障房的民生服务功能。 作为北京非首都功能疏解的重要承载地,自设立以来,雄安新区有序承接了大量来自北京等地的企业、机构及人才。他们来到这片充满…

    2025年2月3日
    16300
  • 哪吒2火热哪些上市公司获益 光线传媒等股价上涨

    哪吒2火热哪些上市公司获益。2月5日,《哪吒之魔童闹海》票房突破51亿,其出品发行公司光线传媒股价涨停。该片的出品方包括成都可可豆动画影视有限公司、北京光线传媒股份有限公司、成都自在境界文化传媒有限公司和北京彩条屋科技有限公司等,由中影数字电影发展(北京)有限公司联合发行。 据企查查APP显示,成都可可豆动画影视有限公司由电影导演饺子杨宇和北京彩条屋科技间接…

    2025年2月5日
    16000
  • 官方:探索逐步扩大免费教育范围 优化教育资源配置

    近日,中共中央、国务院印发了《教育强国建设规划纲要(2024-2035年)》。该纲要提出了一系列措施,以健全与人口变化相适应的基础教育资源统筹调配机制。 深入实施基础教育扩优提质工程,探索逐步扩大免费教育范围。建立基础教育各学段学龄人口变化监测预警制度,优化中小学和幼儿园布局。提高教育公共服务质量和水平,提升普惠性、可及性和便捷性,加强近期和中长期教育资源统…

    2025年1月19日
    19100

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信