阿里雲Aegaeon系統入選國際頂會 破解AI算力資源閒置難題

DoNews
10/18

在首爾舉辦的第31屆操作系統原理研討會上,阿里雲推出的Aegaeon計算池化解決方案獲大會收錄。該研究針對AI模型服務中存在的GPU資源浪費問題,提出了創新性解決路徑。

目前雲服務商普遍面臨算力利用失衡的挑戰。以阿里雲模型市場為例,17.7%的GPU算力僅處理1.35%的請求,資源閒置現象突出。Aegaeon系統通過GPU資源池化技術,實現單個GPU動態服務多個AI模型,成功打破傳統綁定模式。

經過三個月測試,該系統在服務720億參數大模型時,將所需H20 GPU數量從1192個降至213個,降幅達82%。這項由北京大學與阿里雲合作的研究,為行業提供了全新的優化方案。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10