消息称华为即将发布 AI 推理领域突破性成果：降低对 HBM 依赖，提升国内大模型性能-网络资讯-红帽SEO工作室

当前位置：红帽SEO工作室网络资讯消息称华为即将发布 AI 推理领域突破性成果：降低对 HBM 依赖，提升国内大模型性能

→ 源码教程下载地址见 →右侧下载链接 →点“登录购买”→注册登录购买后可见→
→ 这里没有广告，只有干货！给力项目更多教程，点此加入VIP会员,即可免费下载！
→ 每日分享你意想不到的网络思维！加入红帽VIP会员，感受一下网络赚钱的快感，点击进入了解。

8 月 10 日消息，据《科创板日报》报道，华为将于 8 月 12 日在 2025 金融 AI 推理应用落地与发展论坛上，发布 AI 推理领域的突破性技术成果。据透露，这项成果或能降低中国 AI 推理对 HBM（高带宽内存）技术的依赖，提升国内 AI 大模型推理性能，完善中国 AI 推理生态的关键部分。

华为在 AI 推理领域的技术突破已有先例。2025 年 3 月，北京大学联合华为发布了 DeepSeek 全栈开源推理方案，该方案基于北大自研 SCOW 算力平台系统和鹤思调度系统，整合了 DeepSeek、openEuler、MindSpore 与 vLLM / RAY 等社区开源组件，实现了华为昇腾上的 DeepSeek 高效推理。

在性能方面，华为昇腾已实现多项突破。例如 CloudMatrix 384 超节点部署 DeepSeek V3 / R1 时，在 50ms 时延约束下单卡 Decode 吞吐突破 1920 Tokens / s；Atlas 800I A2 推理服务器在 100ms 时延约束下单卡吞吐达到 808 Tokens / s。

科大讯飞与华为的合作也取得了显著成果，双方率先实现了国产算力上 MoE 模型的大规模跨节点专家并行集群推理，使推理吞吐提升 3.2 倍，端到端时延降低 50%。

华为 AI 大模型

温馨提示：
1、如非特别声明，本内容转载于网络，版权归原作者所有！
2、本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
3、本内容若侵犯到你的版权利益，请联系我们，会尽快给予删除处理！
我要投诉
红帽SEO工作室 » 消息称华为即将发布 AI 推理领域突破性成果：降低对 HBM 依赖，提升国内大模型性能

红帽seo

分享到：

红帽seo

相关推荐

咨询在线客服