近日,在韓國首爾舉辦的頂級學術會議SOSP 2025(操作系統原理研討會)上,阿里雲發布了其「Aegaeon」計算池化解決方案(相關論文已被入選),該方案可解決AI模型服務中普遍存在的GPU資源浪費問題,將大型語言模型所需的GPU數量減少了82%,大幅提升GPU資源利用率,顯著降低了AI模型服務中的成本。目前該核心技術已應用在阿里雲百鍊平台。SOSP(操作系統原理研討會)由ACM SIGOPS主辦...
網頁鏈接近日,在韓國首爾舉辦的頂級學術會議SOSP 2025(操作系統原理研討會)上,阿里雲發布了其「Aegaeon」計算池化解決方案(相關論文已被入選),該方案可解決AI模型服務中普遍存在的GPU資源浪費問題,將大型語言模型所需的GPU數量減少了82%,大幅提升GPU資源利用率,顯著降低了AI模型服務中的成本。目前該核心技術已應用在阿里雲百鍊平台。SOSP(操作系統原理研討會)由ACM SIGOPS主辦...
網頁鏈接免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。