曝DeepSeek跳出英伟达限制绕过CUDA 为适配中国国产GPU做准备
DeepSeek全球爆火,再一次引发外界对GPU算力限制话题的关注。
据报道,DeepSeek开发的大语言模型绕过了英伟达的CUDA框架,正为未来兼容国产GPU芯片做准备。
众所周知,英伟达的CUDA(Compute Unified Device Architecture,统一运算架构)能大幅降低研发大模型的难度,获全球开发商使用,一举将英伟达推上AI芯片领域的垄断地位。
但最新发现显示,DeepSeek使用英伟达的H800芯片训练时,使用英伟达底层硬件指令PTX(Parallel Thread Execution)语言,而非高级编程语言CUDA。
这样意味着DeepSeek绕过了CUDA,使用更底层的编程语言做优化。
对于程序开发人员来说,CUDA是一种更加友好的高级语言,开发者只需要专注于程序和算法最相关的运行逻辑,而不太需要考虑具体的程序是如何在GPU等硬件上具体如何执行计算的,从而能够降低开发难度。
而PTX在接近汇编语言的层级运行,允许进行细粒度的优化,如寄存器分配和Thread / Warp级别的调整。这种编程非常复杂且难以维护,所以行业通用的做法是使用CUDA这样的高级编程语言。
换句话说,DeepSeek把优化做到了极致。
北京航空航天大学副教授黄雷表示,绕过CUDA可以直接根据GPU的驱动函数做一些新的开发,从而实现更加细粒度的操作。
这也说明DeepSeek拥有一些擅长写PTX语言的内部开发者。假如它之后使用国产GPU,其在硬件适配方面将会更得心应手,其只要了解这些硬件驱动提供的一些基本函数接口,就可以仿照英伟达GPU硬件的编程接口去写相关的代码,从而让自家大模型更加容易适配国产硬件。
“这凸显了DeepSeek非凡的工程水平,并表明美国对华制裁加剧的“GPU短缺危机”激发了他们紧迫感和创造力。”韩国Mirae Asset Securities Research的一名分析师表示。
-
深度deepin 23.1正式发布!AI默认引擎切换至DeepSeek
今天,深度操作系统宣布,deepin 23.1版本已正式发布。此版本聚焦于解决基础组件更新后的安装效率问题,大幅提升新用户安装体验,同时集成多项功能优化与问题修复,进一步优化系统使用。本次版本的重点改
-
刘慈欣谈DeepSeek:完全有可能替代科幻小说作家
日前,2025中国科幻大会在北京举办,主题为“科学梦想 创造未来”。在大会论坛上,科幻作家刘慈欣谈到了DeepSeek对科幻文学的驱动和发展。据央视财经报道,对于DeepSeek未来是否有可能替代科幻
-
DeepSeek推出FlashMLA项目 可以显著降低内存占用和计算开销
开源人工智能技术开发商 DeepSeek 上周已经预告将在本周陆续推出 5 个已经在生产环境中使用的技术,目前首个项目 FlashMLA 已经在 GitHub 上公布。FlashMLA 是一种针对 N
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/
- 刘作虎:所有想要用手机替代电脑的想法都是愚蠢的
- MagicMirror 轻量级零门槛的AI换脸神器!
- 小鬼当家拍摄地525万美元挂牌待售:影迷曾纷至沓来
- 微软必应聊天改善隐私保护:不保存有敏感信息的聊天记录
- 美元兑人民币汇率2023年9月11日
- 和女高管所生双胞胎被围观!马斯克已有9个孩子:呼吁大家多生为全人类
- 男子健身房内去世前向私教求救 真相不明
- 女生半夜嗦田螺 肿成香肠嘴:网友笑称终于超越梁朝伟
- 陈冠希晒出欧阳娜娜私照 网友惊呼:以为自己看错
- 潘甜甜被抓视频点击量破百万 长相甜美可爱
- 华为Mate 30 RS保时捷版认证二手机官方降价1500
- Type-C充 超云K50Pro喷雾枪39.9元包邮

随时掌握互联网精彩