阿里巴巴正加速推進人工智能基礎設施的自主化進程,已開始使用自研芯片訓練AI模型。
據知情人士透露,阿里巴巴在今年年初已逐步將自主研發的“玄鐵”系列Zhenwu處理單元(Zhenwu Processing Unit)投入實際生產環境,用於訓練中低參數規模的AI模型,標誌着其在大模型算力自主化道路上邁出關鍵一步。
與此前依賴英偉達GPU進行大規模訓練不同,Zhenwu芯片是阿里達摩院聯合平頭哥半導體團隊專爲AI推理與輕量級訓練場景設計的專用加速器。該芯片基於RISC-V架構深度優化,採用異構計算架構,在能效比和成本控制方面具有顯著優勢,尤其適用於模型微調、數據預處理、多模態小模型訓練等對算力密度要求較高但無需極致並行的環節。
目前,Zhenwu芯片已在阿里內部多個業務線試運行,包括通義千問(Qwen)的輕量級版本訓練、淘寶推薦系統的實時增量學習、菜鳥智能分單模型迭代等場景。據內部測試數據顯示,在同等任務下,Zhenwu芯片集羣相較傳統GPU方案可降低約35%的訓練能耗,並減少20%以上的單位算力成本,同時規避了國際供應鏈波動帶來的交付風險。
阿里雲智能集團CTO周靖人曾公開表示:“我們不追求‘所有芯片都自研’,但必須掌握核心能力。”Zhenwu的落地,正是這種務實路徑的體現——不盲目追求最高算力,而是用最適合的芯片解決最實際的問題。