谷歌推出新一代 TPU 與 Arm 架構實例,賦能 AI 工作負載

半導體產業研究
11/10

圖片來源:法新社

谷歌(Google)正式發佈第七代張量處理單元(TPU)Ironwood,專為大規模 AI 模型訓練、強化學習及推理任務設計。

根據谷歌官方新聞稿,Ironwood 的峯值性能較 TPU v5p 提升高達 10 倍,單芯片性能較 TPU v6e(Trillium)提升超 4 倍。該款 TPU 將於未來幾周內全面開放使用。

IronwoodTPU:超大規模集羣部署,突破數據瓶頸

Ironwood 支持以互聯芯片組形式部署,超級芯片組規模可擴展至 9216 個單元,通過速率達 9.6 Tb/s的高速芯片間互連網絡連接。這一配置能讓數千顆芯片共享 1.77 PB的高帶寬內存(HBM),旨在緩解高負載模型的數據傳輸瓶頸。谷歌還融入光電路交換技術,確保中斷情況下工作負載的連續性。

該TPU 是谷歌 AI 超級計算機的核心組成部分,該系統整合了計算、網絡、存儲及軟件資源,以優化系統級效率。MaxText 框架增強、vLLM 支持及 GKE 推理網關升級等舉措,均為提升訓練、強化學習及推理性能而設計。

Axion 系列新增 Arm 架構實例,互補 TPU 算力

谷歌同步推出Axion 產品組合下的全新 Arm 架構實例,與 Ironwood 形成功能互補。其中,N4A 實例目前處於預覽階段,作為虛擬機可支持最多 64 個虛擬 CPU(vCPU),配備 12GB DDR5 內存及 50 Gbps網絡帶寬,專為微服務、容器化應用及 AI 數據預處理工作負載設計。

此外,谷歌計劃推出C4A 裸金屬實例(C4A metal),不久後也將進入預覽階段。該實例為裸金屬架構,支持最多 96 個 vCPU、768GB DDR5 內存及高達 100Gbps 的網絡速率,量身適配需專用硬件的工作負載,包括安卓開發、汽車系統及大規模仿真任務。

現有Axion C4A 實例將繼續支持高內存、高網絡需求的工作負載,涵蓋一級網絡服務及高級存儲方案。谷歌將 Axion 定位為支撐運營級與應用級工作負載的核心,與 TPU 的加速能力形成互補,提升整體效率與成本效益。

多機構率先測試,軟硬件協同釋放性能

谷歌透露,Anthropic、Lightricks、Essential AI、Vimeo、ZoomInfo 及 Rise 等機構已啓動 Ironwood TPU 與 Axion 實例的測試工作。谷歌強調,性能提升源於一體化系統級設計,硬件、網絡與軟件的協同研發是關鍵。Ironwood TPU 與 Axion CPU 可協同運行,或與其他計算方案搭配使用,為各類 AI 及運營工作負載提供靈活支持。

原文標題:

Google launches new TPU and Arm-based instances for AI workloads

原文媒體:digitimes asia

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10