阿里云秘密武器亮相顶会：狂砍82%英伟达含量，213块GPU干了1192块的活(阿里云密钥管理服务)

fjmyhfvclm2025年12月07日 05:28阅读:18人科技

阿里云秘密武器亮相顶会：狂砍82%英伟达含量，213块GPU干了1192块的活(阿里云密钥管理服务) 99xcs.com

梦晨发自凹非寺

量子位 | 公众号 QbitAI

阿里云秘密武器亮相顶会SOSP：用新技术砍掉82%的英伟达GPU需求。

一时引起不小关注与讨论。

这项研究由阿里巴巴与北大合作，阿里云CTO周靖人带队。

研究提出最新GPU池化系统Aegaeon，用token级别的自动扩缩容技术，硬是把GPU使用量从1192个“瘦身”到213个。

这项研究出发点在对阿里云自身业务一项观察。

在Model Studio（百炼平台）上，他们发现了一个让人头疼的现象：17.7%的GPU被分配去服务那些几乎没人用的冷门模型，而这些模型只处理了总请求量的1.35%。

之前要同时运行这些模型时，要么给每个模型单独分配GP，很多冷门模型的GPU经常空着浪费，要么用旧方法让一个GPU跑2-3个模型（因为GPU 内存不够，跑不了更多），总之资源利用率特别低。

Aegaeon瞄准这一痛点，通过精细化的资源调度，彻底改变了GPU资源分配的游戏规则。

冷门模型占用长尾资源

具体来说，在他们统计的779个模型中，有94.1%的模型属于长尾模型，平均每秒请求量不到0.2个。

久久小常识(www.99xcs.com)™

与此同时，那些热门模型比如DeepSeek和通义千问虽然请求量大，但也经常出现突发流量，导致预留的GPU资源时而过载、时而闲置。

如果按照理想情况计算，单个GPU每秒应该能处理好几个请求，这意味着当前的资源利用率还有超过10倍的优化空间。

久久小常识(www.99xcs.com)™

传统的做法是给每个模型分配专用GPU，但这种”一对一”的服务模式在面对大量偶发性请求时，简直就是在烧钱。

Token级别调度，让GPU”见缝插针”

Aegaeon的核心创新在于采用了token级别的自动扩缩容技术，而不是像现有系统那样在请求级别进行调度。

具体来说，系统会在生成每个token时动态决定是否需要切换模型，而不是等到整个请求处理完才考虑切换。

如此一来，可以让让GPU灵活处理多个模型的请求，大大减少了模型之间的等待时间。论文显示，通过这种方式，单个GPU可以同时服务多达7个不同的模型。

久久小常识(www.99xcs.com)™

为了实现这个目标，研究团队还进行了一系列底层优化：

通过组件复用减少了80%的初始化开销；
采用显式内存管理避免了内存碎片；
实现了细粒度的KV缓存同步机制，让模型切换时间从几十秒缩短到1秒以内。

整体来看，这些优化将自动扩缩容的开销降低了97%。

久久小常识(www.99xcs.com)™

实战效果：吞吐量提升9倍

Aegaeon展现出最高可达9倍的性能提升，最低也有1.5倍，计算资源得到了极大的优化。

根据论文数据，与现有的ServerlessLLM和MuxServe等系统相比，Aegaeon能够支撑2-2.5倍的请求到达率，有效吞吐量（goodput）提升了1.5到9倍。在测试环境中，使用16块H800 GPU的集群，系统成功服务了从6B到72B参数规模的多个模型。

久久小常识(www.99xcs.com)™

更重要的是，这套系统已经在阿里云百炼平台进行了超过3个月的生产环境测试。

在实际部署中，它服务了47个不同规模的模型，包括28个1.8B-7B的小模型和19个32B-72B的大模型。GPU利用率从之前的13.3%-33.9%提升到了48.1%，期间没有出现任何SLO违规或服务中断。

相关内容

炸裂！26岁男星自曝被富婆控制6年，富婆竟然让他结扎，太惨了！(26岁演员有哪些)

炸裂！26岁男星自曝被富婆控制6年，富婆竟然让他结扎，太惨了！(26岁演员有哪些)

这位年轻艺人揭露自己深陷一场持续六年的畸形关系，遭遇中年女性郝女士从物质赠予逐步升级到精神操控的残酷经历，其中甚至包括被安排绝育手术的骇人桥段。实际上2022年就曾有相关录音流出，当时丁泽仁在音频中反复强调"…...

甲流吃什么药效果最好常用药物参考(甲流吃什么药效果最好12岁孩子)

甲流吃什么药效果最好常用药物参考(甲流吃什么药效果最好12岁孩子)

甲流，即甲型流感，是由甲型流感病毒引起的一种急性呼吸道传染病，具有较强的传染性。感染甲流后，患者通常会出现高热、咳嗽、喉咙痛、乏力等症状，严重影响生活和健康。合理用药对于缓解症状、缩短病程至关重要。那么，甲流吃什么药效果最好呢？下面为大家介...

专家称北方流感基本达峰南方仍攀升！(我国北方地区流感流行季节)

专家称北方流感基本达峰南方仍攀升！(我国北方地区流感流行季节)

专家称北方流感基本达峰南方仍攀升。当前，流感季正持续“冲顶”，感染人群基数扩大带动用药需求激增。与往年不同的是，今年的抗流感战场已不再是进口药与经典老药的天下。随着多款国产创新药今年密集上市，以“一次服药，全程起效”为卖点的新一代流感药竞赛...

巩俐：巅峰时期，却嫁给“四婚”的70多岁法国老头，她图什么啊？(巩俐成就)

巩俐：巅峰时期，却嫁给“四婚”的70多岁法国老头，她图什么啊？(巩俐成就)

世界各地的影迷都表达了他们的震惊和不解，纷纷在互联网上留言、发帖，询问到底发生了什么而对于这对年龄相差近三十岁的“忘年恋”，公众也产生了种种猜测和质疑然而，无论外界的反应如何，巩俐与她的丈夫依然坚定的走在了…...

钰晟电子取得设有卡固组件的微型UVLED背光源专利，转动压板快速压住定位盖板比拧螺丝更快速(珏晟新材料)

钰晟电子取得设有卡固组件的微型UVLED背光源专利，转动压板快速压住定位盖板比拧螺丝更快速(珏晟新材料)

国家知识产权局信息显示，东莞市钰晟电子科技有限公司取得一项名为“一种设有卡固组件的微型UVLED背光源”的专利，授权公告号CN223611815U，申请日期为2024年12月。企业注册资本100万人民币。声…...

想了解生态浮岛浮床价格？河北雄安莲瑞农业科技为你解答(生态浮岛剖面图)

想了解生态浮岛浮床价格？河北雄安莲瑞农业科技为你解答(生态浮岛剖面图)

该公司能制作与安装人工生态浮岛、生态浮床、浮动湿地等，承接深水区域水面绿化、污水处理浮岛工程以及沉水植物生态浮床水生态修复治理工程。园林景观公司在公园、庭院、花苑小区、景点旅游等场所的项目设计和施工时，会选择…...

四次提名，部部都是经典，这一次，易烊千玺用实力证明了自己(各部部长提名)

四次提名，部部都是经典，这一次，易烊千玺用实力证明了自己(各部部长提名)

当世人将目光倾注于他人之时，他在组合解散后选择潜心修学，同时拓展艺术疆域，在歌唱、舞蹈、戏剧三重维度精进不休。四度入围金鸡奖的征程中，他每次皆以断层式表演实力向行业宣告：这才是新时代演员的演技标高。这场…...

剧出横店 |《天书黎明》定档李宏毅苏晓彤余承恩携手探案(2026年横店剧组2月开机)

剧出横店 |《天书黎明》定档李宏毅苏晓彤余承恩携手探案(2026年横店剧组2月开机)

在横店影视城拍摄完成的网剧《天书黎明》11 月 30 日优酷开播！《天书黎明》江湖集结预告领衔主演：符生（李宏毅饰）、文珏（苏晓彤饰）、顾天（余承恩饰）《天书黎明》乱局相逢海报《天书黎明》由优…...

西宁治疗乳房硬块医院有哪些？这份医院名单你一定要收藏！(青海西宁中医院乳腺科)

西宁治疗乳房硬块医院有哪些？这份医院名单你一定要收藏！(青海西宁中医院乳腺科)

乳房硬块是很多女性可能会遇到的问题，它可能由多种原因引起，如乳腺增生、乳腺纤维瘤等。及时找到专业的医院进行诊断和治疗至关重要。在西宁，有不少能够治疗乳房硬块的医院。接下来，我们就为大家详细介绍西宁治疗乳房硬块的相关医院情况。...

看电视不开灯伤眼睛吗环境光线是关键(看电视不开灯会散光吗?)

看电视不开灯伤眼睛吗环境光线是关键(看电视不开灯会散光吗?)

在日常生活中，很多人都有这样的习惯，晚上看电视时为了营造一种类似影院的氛围，喜欢把灯关掉。然而，这种做法究竟会不会对眼睛造成伤害呢？其实，这其中的关键因素在于环境光线。接下来，我们就详细探讨一下看电视不开灯与眼睛健康之间的关系。...

毛晓彤彻底找到女神自信，身穿蓝绿色钻石连衣裙尽显绝代芳华！(毛晓彤遇到)

毛晓彤彻底找到女神自信，身穿蓝绿色钻石连衣裙尽显绝代芳华！(毛晓彤遇到)

这次选这条裙子，绝对不是随便穿穿，而是她内心状态的直接体现 ——我就是要美，要耀眼，要让所有人都看到我的光芒！这种从内到外的底气，比任何昂贵的珠宝都要闪亮，穿上这条裙子的她，就像装备了满级 buff，走路都…...

周公解梦:50岁女人梦见鞋破了，难道真是吉兆？(周公解梦50岁女人梦见树上有好几个知了猴)

周公解梦:50岁女人梦见鞋破了，难道真是吉兆？(周公解梦50岁女人梦见树上有好几个知了猴)

梦境常常是神秘且令人好奇的，它似乎隐藏着某种潜在的寓意。对于50岁的女人来说，生活正处于一个独特的阶段，此时的梦境或许更值得探究。当50岁女人梦见鞋破了，这一梦境究竟代表着什么呢？真的如一些说法那样是吉兆吗？让我们一起来深入分析。...

接种疫苗后为啥还会感染？是否与生活习惯和防护不足相关(接种疫苗后为啥不能洗澡)

接种疫苗后为啥还会感染？是否与生活习惯和防护不足相关(接种疫苗后为啥不能洗澡)

流感季节，很多人选择接种疫苗来预防感染。然而，仍有部分人在接种后还是“中招”了。这让大家十分疑惑，为啥接种了疫苗还会感染呢？这背后是否和我们的生活习惯以及防护措施没做到位有关呢？让我们一起来探究一下。...

通讯｜中国剧集出海：讲述世界共鸣的中国故事(中国通讯图片)

通讯｜中国剧集出海：讲述世界共鸣的中国故事(中国通讯图片)

土耳其文化和旅游部电影事务副总干事塞尔丘克·亚武兹卡纳特说，中国影视内容质量颇高，土耳其国内播放过一些中国剧，反响很好，“未来几年，我们希望能引进更多”。她说，以《太平年》为例，剧本开发阶段就运用人工智能分…...

豆包首批AI手机快速售罄，端侧硬件生态受关注(豆包网是什么公司)

豆包首批AI手机快速售罄，端侧硬件生态受关注(豆包网是什么公司)

据媒体报道，豆包手机一经公布，便引起市场轩然大波，作为工程样机数量之少，也引发二手市场涨价潮。供应链人士表示，字节跳动此次确实是试水市场，手机备货量不多，首批产品约3万台的备货，已经售罄，项目方并未追加物料投…...

【高校主办】2026年第六届控制理论与应用国际会议（ICoCTA 2026）(高校2020cypher)

【高校主办】2026年第六届控制理论与应用国际会议（ICoCTA 2026）(高校2020cypher)

会议介绍会议将围绕控制理论与应用的最新研究领域，为来自国内外高等院校、科学研究所、企事业单位的专家、教授、学者、工程师等提供一个分享专业经验，扩大专业网络，面对面交流新思想以及展示研究成果的国际平台，探讨本…...