炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛力主題機會!
IT之家 6 月 13 日消息,在今日凌晨的AMD Advancing AI 2025 活動中,AMD 正式推出其下一代開源軟件棧技術 ROCm 7,進一步加速 AI 與開發者生產力。
隨着 ROCm 7 的發佈,AMD 終於從其 ROCm 6 軟件棧向前邁進,該軟件棧在過去幾年中 —— 尤其是在 AI 計算出現以來 —— 已經經歷了多次更新。以下是 AMD 在 ROCm 7 中重點關注的一些功能:
通過 ROCm,AMD 表示其正更加專注於其軟件堆棧中日益增長的推理能力。ROCm 7 堆棧將包括增強型框架,如 vLLM v1、llm-d、SGLang,並專注於提供多種優化。即將到來的 ROCm 7 新內核和算法包括 GEMM 自動調優、MoE、Attention 和基於 Python 的內核編寫。
AMD 已宣佈對其 MI350 系列提供 FP6 和 FP4 支持,ROCm 7 也包含對這些高級數據類型的全面支持,如 FP8、FP6、FP4 和混合精度。
IT之家從發佈會獲悉,在性能方面,AMD 表示 ROCm 7 將推理作爲重點,爲 AI 工作負載帶來了高達 3.5 倍的性能提升。
具體來看,相較於 ROCm 6,ROCm 7 的 Llama 3.1 70B 提升了 3.2 倍,Qwen2-72B 提升了 3.4 倍,DeepSeek R1 提升了 3.8 倍。
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。