阿里云推出全新AI计算解决方案：大模型所需GPU狂降82%！-网络资讯-红帽SEO工作室

当前位置：红帽SEO工作室网络资讯阿里云推出全新AI计算解决方案：大模型所需GPU狂降82%！

→ 源码教程下载地址见 →右侧下载链接 →点“登录购买”→注册登录购买后可见→
→ 这里没有广告，只有干货！给力项目更多教程，点此加入VIP会员,即可免费下载！
→ 每日分享你意想不到的网络思维！加入红帽VIP会员，感受一下网络赚钱的快感，点击进入了解。

10月21日消息，在近日于韩国首尔举办的顶级学术会议SOSP 2025（操作系统原理研讨会）上，阿里云发布了其“Aegaeon”计算池化解决方案。

Aegaeon方案的核心在于解决AI模型服务中普遍存在的GPU资源浪费问题，尤其针对那些需求突发或不可预测的大型语言模型。

它打破了传统的“一个模型绑定一个GPU”的低效模式，而是在Token级别虚拟化GPU访问，这意味着单个GPU可以被多个不同模型共享服务，实现精细化的资源调度。

阿里云Aegaeon系统作为一种推理时间调度器，它能在每次生成下一个token后，动态决定是否切换模型，从而将微小的工作片段安排到共享池中。

通过组件复用、显存精细化管理和KV缓存同步优化等全栈技术，Aegaeon将模型切换开销降低了97%，确保了token级调度的实时性，可支持亚秒级的模型切换响应。

在阿里云模型市场为期超三个月的Beta测试中，Aegaeon系统在服务数十个参数量高达720亿的大模型时，所需的NVIDIA H20 GPU数量从1192个锐减至213个，削减比例高达82%。

GPU用量的大幅削减，对于硬件采购成本高昂的大型模型服务商而言，意味着成本将显著降低。

目前，这项核心技术已成功应用在阿里云百炼平台。

阿里云 AI 大模型

温馨提示：
1、如非特别声明，本内容转载于网络，版权归原作者所有！
2、本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
3、本内容若侵犯到你的版权利益，请联系我们，会尽快给予删除处理！
我要投诉
红帽SEO工作室 » 阿里云推出全新AI计算解决方案：大模型所需GPU狂降82%！

分享到：