重大突破！阿里雲：英偉達GPU用量削減82%

芯榜

2025/10/20

顯著提升GPU利用率！2025年10月18日，在韓國首爾舉辦的第31屆操作系統原理研討會（SOSP）上，阿里雲發布的「Aegaeon」計算池化解決方案研究成果成功入選。該方案創新性地解決了AI模型服務中普遍存在的GPU資源浪費問題，在阿里雲模型市場測試中，實現了英偉達GPU用量大幅削減82%的顯著成效。SOSP（操作系統原理研討會）由ACM SIGOPS主辦，是計算機系統領域頂級學術會議，平均每年...

網頁鏈接

免責聲明：投資有風險，本文並非投資建議，以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請，作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考，不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證，投資者應自行研究並在投資前尋求專業建議。

熱議股票

{"basename":"/hant","ssrTDKData":{"titleTemplate":"%s - 老虎證券","title":"老虎证券全球投资理财平台| 一站式投资美股新股港股A股","description":"老虎证券助您一站式投资美股，新股，港股，A股等全球金融理财产品。新加坡华人最信赖的在线投资平台，现在加入即享低费用，24/5 无时差炒美股投资理财！","keywords":"老虎證券,老虎證券開戶,老虎券商,老虎證券官網,老虎證券app,tigertrade老虎證券,股票,炒股,新加坡股票交易平臺,投資,投資理財","social":{"ogDescription":"老虎证券助您一站式投资美股，新股，港股，A股等全球金融理财产品。新加坡华人最信赖的在线投资平台，现在加入即享低费用，24/5 无时差炒美股投资理财！","ogImage":"https://c1.itigergrowtha.com/portal5/static/media/og-logo.be62fbe1.png","ogUrl":"https://www.itiger.com/hant/news/2576889004"},"companyName":"老虎證券"},"pageData":{"isMobile":false,"isTiger":false,"isTTM":true,"region":"SGP","license":"TBSG","edition":"fundamental"},"isCrawlerRequest":true,"__swrFallback__":{"@#url:\"https://stock-news.skytigris.cn/v3/news\",params:#id:\"2576889004\",edition:\"fundamental\",auth_exemption:1,,,undefined,":{"share":"https://ttm.financial/m/news/2576889004?lang=zh_TW&edition=fundamental","thumbnail":"","is_english":false,"pubTime":"2025-10-20 11:24","share_image_url":"https://static.laohu8.com/9a95c1376e76363c1401fee7d3717173","id":"2576889004","market":"us","top_or_hot":-1,"title":"重大突破！阿里雲：英偉達GPU用量削減82%","media":"芯榜","content":"<div>\n<p>顯著提升GPU利用率！2025年10月18日，在韓國首爾舉辦的第31屆操作系統原理研討會（SOSP）上，阿里雲發布的「Aegaeon」計算池化解決方案研究成果成功入選。該方案創新性地解決了AI模型服務中普遍存在的GPU資源浪費問題，在阿里雲模型市場測試中，實現了英偉達GPU用量大幅削減82%的顯著成效。SOSP（操作系統原理研討會）由ACM SIGOPS主辦，是計算機系統領域頂級學術會議，平均每年...</p>\n\n<a href=\"http://gu.qq.com/resources/shy/news/detail-v2/index.html#/?id=nesSN20251020113426a6c2dbcb&s=b\">網頁鏈接</a>\n\n</div>\n","source":"tencent","html":"<!DOCTYPE html>\n<html>\n<head>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />\n<meta name=\"viewport\" content=\"width=device-width,initial-scale=1.0,minimum-scale=1.0,maximum-scale=1.0,user-scalable=no\"/>\n<meta name=\"format-detection\" content=\"telephone=no,email=no,address=no\" />\n<title>重大突破！阿里雲：英偉達GPU用量削減82%</title>\n<style type=\"text/css\">\na,abbr,acronym,address,applet,article,aside,audio,b,big,blockquote,body,canvas,caption,center,cite,code,dd,del,details,dfn,div,dl,dt,\nem,embed,fieldset,figcaption,figure,footer,form,h1,h2,h3,h4,h5,h6,header,hgroup,html,i,iframe,img,ins,kbd,label,legend,li,mark,menu,nav,\nobject,ol,output,p,pre,q,ruby,s,samp,section,small,span,strike,strong,sub,summary,sup,table,tbody,td,tfoot,th,thead,time,tr,tt,u,ul,var,video{ font:inherit;margin:0;padding:0;vertical-align:baseline;border:0 }\nbody{ font-size:16px; line-height:1.5; color:#999; background:transparent; }\n.wrapper{ overflow:hidden;word-break:break-all;padding:10px; }\nh1,h2{ font-weight:normal; line-height:1.35; margin-bottom:.6em; }\nh3,h4,h5,h6{ line-height:1.35; margin-bottom:1em; }\nh1{ font-size:24px; }\nh2{ font-size:20px; }\nh3{ font-size:18px; }\nh4{ font-size:16px; }\nh5{ font-size:14px; }\nh6{ font-size:12px; }\np,ul,ol,blockquote,dl,table{ margin:1.2em 0; }\nul,ol{ margin-left:2em; }\nul{ list-style:disc; }\nol{ list-style:decimal; }\nli,li p{ margin:10px 0;}\nimg{ max-width:100%;display:block;margin:0 auto 1em; }\nblockquote{ color:#B5B2B1; border-left:3px solid #aaa; padding:1em; }\nstrong,b{font-weight:bold;}\nem,i{font-style:italic;}\ntable{ width:100%;border-collapse:collapse;border-spacing:1px;margin:1em 0;font-size:.9em; }\nth,td{ padding:5px;text-align:left;border:1px solid #aaa; }\nth{ font-weight:bold;background:#5d5d5d; }\n.symbol-link{font-weight:bold;}\n/* header{ border-bottom:1px solid #494756; } */\n.title{ margin:0 0 8px;line-height:1.3;color:#ddd; }\n.meta {color:#5e5c6d;font-size:13px;margin:0 0 .5em; }\na{text-decoration:none; color:#2a4b87;}\n.meta .head { display: inline-block; overflow: hidden}\n.head .h-thumb { width: 30px; height: 30px; margin: 0; padding: 0; border-radius: 50%; float: left;}\n.head .h-content { margin: 0; padding: 0 0 0 9px; float: left;}\n.head .h-name {font-size: 13px; color: #eee; margin: 0;}\n.head .h-time {font-size: 12.5px; color: #7E829C; margin: 0;}\n.small {font-size: 12.5px; display: inline-block; transform: scale(0.9); -webkit-transform: scale(0.9); transform-origin: left; -webkit-transform-origin: left;}\n.smaller {font-size: 12.5px; display: inline-block; transform: scale(0.8); -webkit-transform: scale(0.8); transform-origin: left; -webkit-transform-origin: left;}\n.bt-text {font-size: 12px;margin: 1.5em 0 0 0}\n.bt-text p {margin: 0}\n</style>\n</head>\n<body>\n<div class=\"wrapper\">\n<header>\n<h2 class=\"title\">\n重大突破！阿里雲：英偉達GPU用量削減82%\n</h2>\n<h4 class=\"meta\">\n<p class=\"head\">\n<strong class=\"h-name small\">芯榜</strong><span class=\"h-time small\">2025-10-20 11:24</span>\n</p>\n</h4>\n</header>\n<article>\n<div>\n<p>顯著提升GPU利用率！2025年10月18日，在韓國首爾舉辦的第31屆操作系統原理研討會（SOSP）上，阿里雲發布的「Aegaeon」計算池化解決方案研究成果成功入選。該方案創新性地解決了AI模型服務中普遍存在的GPU資源浪費問題，在阿里雲模型市場測試中，實現了英偉達GPU用量大幅削減82%的顯著成效。SOSP（操作系統原理研討會）由ACM SIGOPS主辦，是計算機系統領域頂級學術會議，平均每年...</p>\n\n<a href=\"http://gu.qq.com/resources/shy/news/detail-v2/index.html#/?id=nesSN20251020113426a6c2dbcb&s=b\">網頁鏈接</a>\n\n</div>\n\n<div class=\"bt-text\">\n\n\n<p> 來源：<a href=\"http://gu.qq.com/resources/shy/news/detail-v2/index.html#/?id=nesSN20251020113426a6c2dbcb&s=b\">芯榜</a></p>\n<p>為提升您的閱讀體驗，我們對本頁面進行了排版優化</p>\n\n\n</div>\n</article>\n</div>\n</body>\n</html>\n","isBrief":false,"type":0,"news_type":1,"symbol":"LU0786609619.USD","symbol_name":"高盛全球千禧一代股票組合Acc","start_time":0,"source_url":"http://gu.qq.com/resources/shy/news/detail-v2/index.html#/?id=nesSN20251020113426a6c2dbcb&s=b","article_id":"2576889004","we_media_id":null,"thumbnails":[],"rights":{"source":"tencent","url":"http://gu.qq.com/resources/shy/news/detail-v2/index.html#/?id=nesSN20251020113426a6c2dbcb&s=b","rn_cache_url":null,"customStyle":"body{padding-top:10px;}#news_title{font-weight:bold;#titleStyle#;}#news_description span{font-size:12px;#descriptionStyle#;}.footer-note{#statement#}","selectors":".mod-LoadTzbdNews, body","filters":".relate-stock, .hot-list, .recom-box, .wx-sou","directOrigin":true},"url":"https://stock-news.laohu8.com/highlight/detail?id=2576889004","pubTimestamp":1760930660,"columns":[],"sourceInfo":{"source_id":"tencent","name":"腾讯"},"weMediaInfo":null,"summary":"這種「長尾效應」致使大量資源閒置，在阿里雲模型市場中，高達17.7%的GPU算力僅用於處理1.35%的請求，造成了高昂的成本浪費。圖｜研究框架圖為解決這一痛點，阿里雲推出Aegaeon系統。測試數據顯示，在服務數十個參數量高達720億的大模型時，所需的英偉達H20 GPU數量從1192個成功減少至213個，用量削減82%。","collect":0,"end_time":0,"defaultTopTitle":"qq.com","property":[],"viewcount":null,"language":"zh","relate_stocks":{"LU0786609619.USD":"高盛全球千禧一代股票组合Acc","NVDY":"NVDA期权收益策略ETF-YieldMax","SNVD.UK":"LS -1X NVIDIA","IE00BZ1G4Q59.USD":"LEGG MASON CLEARBRIDGE US EQUITY SUSTAINABILITY LEADER \"A\"(USD) INC (A)","LU2360106780.USD":"BGF WORLD TECHNOLOGY \"A4\" (USD) INC","LU2430703251.USD":"WELLINGTON MULTI-ASSET HIGH INCOME \"AM4\" (USD) INC","LU1366333091.USD":"FIDELITY GLOBAL FOCUS \"A\" (USD) ACC","LU0077335932.USD":"FIDELITY AMERICAN GROWTH \"A\" INC","IE0009356076.USD":"JANUS HENDERSON GLOBAL TECHNOLOGY AND INNOVATION \"A2\" (USD) ACC","LU1803068979.SGD":"FTIF - Franklin Technology A (acc) SGD-H1","2NVD.UK":"2X NVIDIA ETP","LU1037948897.HKD":"AB LOW VOLATILITY EQUITY PORTFOLIO \"AD\" (HKD) INC","NVD2.UK":"2X NVIDIA ETP","LU0494093205.USD":"贝莱德ESG灵活多元资产A2 USD-H","LU1917777945.USD":"安联专题基金Cl AT Acc","3NVD.UK":"LS 3X NVIDIA","LU2125909247.SGD":"Natixis Thematics Meta H-R/A SGD","LU1037948541.HKD":"AB LOW VOLATILITY EQUITY PORTFOLIO \"A\" (HKD) ACC","SG9999018865.SGD":"United Global Quality Growth Fd Cl Dist SGD-H","SG9999002232.USD":"Allianz Global High Payout USD","SGXZ23171101.USD":"NIKKO AM SHENTON GLOBAL OPPORTUNITIES (USD) ACC","LU0170899867.USD":"EASTSPRING INVESTMENTS WORLD VALUE EQUITY  \"A\" (USD) ACC","LU1821325948.USD":"NINETY ONE GSF GLOBAL MACRO ALLOCATION \"A\" (USD) ACC","LU2237957902.USD":"NIKKO AM GLOBAL EQUITY \"F\" (USD) ACC","LU1699723380.USD":"ALLSPRING GLOBAL LONG/SHORT EQUITY \"AP\" (USD) ACC","NVD":"2倍做空NVDA ETF-GraniteShares","LU0353189763.USD":"ALLSPRING  US ALL CAP GROWTH FUND \"I\" (USD) ACC","IE0004091025.USD":"BNY MELLON GLOBAL OPPORTUNITIES \"B\" (USD) ACC","LU1116320737.USD":"BGF SYSTEMATIC GLOBAL ENHANCED EQUITY YIELD \"A6\" (USD) INC","NVD3.UK":"LS 3X NVIDIA","LU1267930490.SGD":"TEMPLETON GLOBAL EQUITY INCOME \"AS\" (SGD) INC A","NVDD":"1倍做空NVDA ETF-Direxion","NVDX":"2倍做多NVDA ETF-T-Rex","GB00BDT5M118.USD":"天利环球扩展Alpha基金A Acc","LU2125909759.SGD":"Natixis Thematics Safety H-R/A SGD","LU0823414551.USD":"BNP PARIBAS ENERGY TRANSITION \"C\" (USD) INC","NVDS.UK":"LS -1X NVIDIA","BK4550":"红杉资本持仓","NVDU":"2倍做多NVDA ETF-Direxion","LU0868494708.USD":"UBS (LUX) EQUITY SICAV - US TOTAL YIELD SUSTAINABLE \"P\" (USD) INC","SGXZ51526630.SGD":"大华环球创新基金A Acc SGD","NVIW.SI":"NVDA 3xLongSG261006","LU0107464264.USD":"abrdn SICAV I - GLOBAL INNOVATION EQUITY \"A\" (USD) ACC","NVDA":"英伟达","LU2097344431.USD":"SCHRODER ISF SUSTAINABLE MULTI-ASSET INCOME \"A\" (USDHDG) INC","LU1280957306.USD":"THREADNEEDLE (LUX) US CONTRARIAN CORE EQUITIES \"AUP\" (USD) INC","NVDS":"1.5倍做空NVDA ETF-Tradr","LU0289960550.SGD":"AB FCP I - GLOBAL EQUITY BLEND PORTFOLIO 'A' (SGD) ACC","LU2433249047.HKD":"THEMATICS META \"R/A\" (HKD) ACC"},"translate_title":"Major breakthrough! Alibaba Cloud: Nvidia GPU usage cut by 82%","themeId":"a262a8655ddeb5d32dc42c3f1c809843","isJumpTheme":false,"ttsUrl":null,"symbols_score_info":{"NVDS":0.6,"NVDY":0.6,"NVDD":0.6,"SNVD.UK":0.6,"NVDS.UK":0.6,"NVD":0.6,"2NVD.UK":0.6,"NVDA":1.5,"NVIW.SI":0.6,"NVDX":0.6,"NVD3.UK":0.6,"NVD2.UK":0.6,"NVDU":0.6,"3NVD.UK":0.6},"content_text":"顯著提升GPU利用率！2025年10月18日，在韓國首爾舉辦的第31屆操作系統原理研討會（SOSP）上，阿里雲發布的「Aegaeon」計算池化解決方案研究成果成功入選。該方案創新性地解決了AI模型服務中普遍存在的GPU資源浪費問題，在阿里雲模型市場測試中，實現了英偉達GPU用量大幅削減82%的顯著成效。SOSP（操作系統原理研討會）由ACM SIGOPS主辦，是計算機系統領域頂級學術會議，平均每年收錄的論文數量僅有數十篇，被譽為計算機操作系統界的「奧斯卡」，本屆SOSP大會僅收錄66篇論文。目前，雲服務商在提供AI模型服務時，資源效率低下問題突出。平台需託管數千個AI模型以應對海量併發API調用，但用户請求常集中於少數熱門模型，如阿里巴巴的Qwen系列模型。這種「長尾效應」致使大量資源閒置，在阿里雲模型市場中，高達17.7%的GPU算力僅用於處理1.35%的請求，造成了高昂的成本浪費。圖｜研究框架圖為解決這一痛點，阿里雲推出Aegaeon系統。該系統運用創新的GPU資源池化技術，打破了以往GPU與特定模型綁定的低效模式，允許單個GPU動態服務於多個不同的AI模型。在阿里雲模型市場進行的為期超三個月的Beta測試中，Aegaeon系統展現出卓越效能。測試數據顯示，在服務數十個參數量高達720億的大模型時，所需的英偉達H20 GPU數量從1192個成功減少至213個，用量削減82%。這意味着僅用213張卡就完成了原本1192張卡才能完成的工作，極大地提高了資源利用率，降低了成本。此次由北京大學與阿里雲合作的研究成果，被認為是「首個揭示並解決市場上併發大語言模型服務存在過高成本」的公開工作，為行業提供了全新的優化思路。SOSP作為計算機操作系統領域的頂尖會議，錄取率控制嚴格，平均每年收錄論文僅數十篇，入選論文代表了操作系統和軟件領域最具代表性的研究成果，Aegaeon系統研究成果的入選，無疑是對阿里雲在該領域創新能力的高度認可。阿里雲Aegaeon計算池化解決方案的推出，不僅為自身解決了AI模型服務中的資源浪費問題，也為整個雲服務和AI產業提供了可借鑑的模式，有望推動行業在提升資源效率、降低成本方面邁出重要一步。來源：信創頭條","kind":"news","is_publish_news":true,"is_publish_highlight":false,"is_publish_live":false,"is_publish_wemedia":null,"editions":null,"column":"","sentiment":"-2","news_tag":"dataReport","news_rank":0,"symbols":[],"gpt_button":0,"need_auth":false,"code":"91000000","status":"200"}}}