业内:DeepSeek或准备适配国产GPU 绕过CUDA展现工程实力

尽管春节假期已经过半,但“来自东方的神秘力量的 DeepSeek”仍在全球范围内引起热议。各路业内人士从不同角度分析 DeepSeek 的模型和技术。

业内:DeepSeek或准备适配国产GPU

韩国 Mirae Asset Securities Research 的一名分析师在 X 撰写长文分析称,这一突破是通过实施大量细粒度优化和使用英伟达的汇编式 PTX 编程实现的,而非通过 CUDA 中的某些功能。CUDA 是由英伟达开发的一种通用编程框架,允许开发者利用 GPU 进行通用计算。如果 DeepSeek 绕过了 CUDA,这说明其研发团队在大模型训练中采用了不同的技术路径。

业内:DeepSeek或准备适配国产GPU 绕过CUDA展现工程实力

对于程序开发人员来说,CUDA 类似于一种高级语言,降低了开发难度,使开发者能够专注于算法逻辑而无需过多考虑硬件执行细节。例如,使用高级语言进行变量赋值操作只需一条命令,而用汇编语言则需要多条指令并理解寄存器、内存等概念。因此,CUDA 便于开发基于 GPU 的算法设计。

业内:DeepSeek或准备适配国产GPU 绕过CUDA展现工程实力

大模型开发商通常基于 CUDA 进行研发,因为 CUDA 已经封装了一些常用函数,简化了开发过程。然而,这种通用性也带来了一定的灵活性损失。对于有特定需求的开发者,如需要精细化控制多个 GPU 之间的数据传输,CUDA 可能无法提供高效的解决方案。

当使用单个 GPU 时,CUDA 非常适用。但在多节点多 GPU 环境下,CUDA 的抽象层面效率较低。开发者可以通过组合 GPU 驱动提供的函数接口来提高效率,或者直接调用底层硬件接口以实现更高效的大模型研发。绕过 CUDA 可以直接根据 GPU 的驱动函数进行新的开发,从而实现更加细粒度的操作。

DeepSeek 在多节点通信时绕过了 CUDA 直接使用 PTX,这使得模型训练速度更快。这意味着在相同时间内可以处理更多数据,间接提高了模型效果。绕过 CUDA 并非新鲜做法,一些开源框架如 Triton 也在尝试替代 CUDA。

AI 技术人员在本科阶段通常接触的是基于深度学习框架(如 Python)的神经网络训练,很少直接编写 CUDA 相关的 C++ 代码。工作后,他们可能因项目需求接触到针对具体硬件资源的编程,但通常不需要绕过 CUDA 来写模型训练算法。然而,由于算力短缺等原因,大模型训练确实需要更高效的算力利用方法。

DeepSeek-V3 的技术报告提到使用了英伟达的 PTX 语言。相比 CUDA 提供的编程接口,PTX 能更精细地控制 GPU 之间的数据传输,但也要求更高的专业技能。绕过 CUDA 的做法具有一定的技术难度,需要开发者既懂 AI 算法又懂计算机系统架构。DeepSeek 显然招聘了具备这些技能的人才,并将他们有效地组织起来。

此外,DeepSeek 的技术报告表明其主体实现仍基于 CUDA 接口,但在通信部分绕开了 CUDA。这意味着 DeepSeek 拥有一些擅长写 PTX 语言的内部开发者。未来,若使用国产 GPU,DeepSeek 将更容易适配这些硬件。从工程角度看,DeepSeek 的技术非常有技巧,且已与 AMD 合作,未来可能与其他 GPU 厂商合作。韩国分析师认为,这反映了 DeepSeek 在面对“GPU 短缺危机”时展现出的紧迫感和创造力。

责任编辑:张蕾

主题测试文章,只做测试使用。发布者:火星财经,转转请注明出处:https://www.sengcheng.com/article/16489.html

(0)
火星财经的头像火星财经
上一篇 2025年2月1日 上午11:25
下一篇 2025年2月1日 上午11:25

相关推荐

  • 吴艳妮晒性感肯豆风写真,紧身黑衣大秀完美身材 妮姐新风格引热议

    中国女子100米栏著名运动员吴艳妮最近在社交媒体上分享了一系列动态,标题为“妮姐的奔跑日记”。作为国内外赛事中的佼佼者,吴艳妮以鲜明的个性、热情的性格和姣好的外貌赢得了众多体育迷的喜爱。这次动态迅速吸引了广泛关注。 在分享的照片中,吴艳妮尝试了全新的时尚风格,与以往的运动风截然不同。大部分照片采用黑白调,她身穿黑色紧身衣,修身设计完美展现了她的身材曲线。精致…

    2025年1月20日
    4100
  • 河南大部地区将迎来雨雪过程 温暖退场气温骤降

    这两天温暖的天气给周末增添了舒适感。今天到明天,全省将继续保持温暖。但从周二开始,河南省将迎来雨雪过程。 具体来看,周二(21日)三门峡、洛阳南部局部将有小雨雪。周三(22日)夜里到周四(23日)白天,西南部、南部部分县市将有小雨,高海拔山区有雨夹雪。周五和周六,雨雪范围将进一步扩大。 随着雨雪的到来,这几天的温暖将逐渐消失。从22日开始,最高气温将逐步下降…

    2025年1月20日
    2700
  • 俄军袭击乌克兰工厂画面曝光 基辅工业设施被精准打击

    1月18日清晨,乌克兰首都基辅遭遇导弹袭击,再次引发了国际社会对俄乌冲突的高度关注。乌克兰空军随后在社交媒体上发布消息称,当天早晨俄军从不同方向发射多枚导弹和无人机,对乌克兰多个目标实施了打击。乌方在基辅市及周边空域成功拦截了两枚“伊斯坎德尔”导弹,但仍有部分目标未能避免受损。 袭击发生在基辅市舍甫琴科夫斯基区,这一地区内的“工业企业生产大楼”遭到严重破坏。…

    2025年1月20日
    2700
  • “正月初十早看天,一年不用问神仙”啥意思? 探寻背后的文化底蕴与民俗智慧

    正月初十早看天,一年不用问神仙啥意思。在中国丰富多彩的民俗文化中,正月初十这一天承载着诸多传统观念与美好寓意。老话说得好:“正月初十早看天,一年不用问神仙。”这句话不仅体现了古人对自然现象的细致观察,还蕴含了对未来一年生活的美好期许与预测。在这个特别的日子里,有许多预兆和习俗值得探寻。 正月初十,在民间又被称为“石头节”。相传这一天是石头的生日,人们为了祈求…

    2025年2月7日
    1600
  • 《哪吒2》太乙真人为何满口四川腔 方言增添笑料

    近日,《哪吒2之魔童闹海》在各大院线热播。2月5日中午12时,电影官方微博宣布总票房突破51亿元,成为中国影史动画电影票房冠军。 影片中的太乙真人说着四川话,成为影片笑点的重要来源。《哪吒之魔童降世》中,太乙真人在自我介绍时提到“吾乃乾元山金光洞太乙真人”。据四川省江油市人民政府网资料,乾元山金光洞位于江油市含增镇境内,山势跌宕、威武奇险;金光洞又名太乙洞、…

    2025年2月9日
    2300

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信