炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛力主題機會!
(來源:超能網)
AMD宣佈,對ROCm軟件棧進行了更新,推出了新的迭代版本ROCm 7.0,這也是迄今爲止最大規模的更新之一。這一新版本里,AMD引入了增強的框架和新算法,旨在打造可替代英偉達CUDA的計算生態系統。
AMD表示,人工智能創新正以前所未有的速度加速,模型擴展到數千億個參數,推理需求不斷增長,企業需要平衡成本和性能的可擴展高效解決方案。開發人員面臨着越來越大的壓力,既要跟上這些要求,又要確保靈活性、可移植性和未來準備。ROCm 7.0的發佈,使得開發人員和企業能夠更快地行動、更智能地擴展並部署AI。
ROCm 7.0主要特性:
在今年6月的AMD Advancing AI 2025上,AMD發佈了基於CDNA 4架構的Instinct MI350系列計算卡。其基於迭代升級後的芯片堆疊封裝工藝打造,採用N3P工藝的加速器複合核心(XCD)通過COWOS-S封裝技術堆疊在採用N6工藝的I/O核心(IOD)之上,3D混合架構爲帶來了高性能密度和高能效比,IOD-IOD互連以及HBM3E顯存的集成則給予2.5D架構打造。
AMD Instinct MI350系列GPU包含有8個XCD模塊,每個XCD模塊32組計算單元,共計256組,1024個矩陣核心,每個XCD配置2MB L2緩存;IOD基於2個N6工藝核心構成,提供有128通道HBM3E顯存接口與256MB容量的AMD Infinity緩存;2個HBM3E顯存採用8堆棧結構,每個堆棧爲12層堆疊的36GB,數據頻率爲8Gbps,可提供8TB/s的顯存帶寬;內部所用的Infinity Fabric AP互聯帶寬達到5.5TB/s,外部連接則基於1075GB/s帶寬的第四代Infinity Fabric總線與128GB/s帶寬的PCIe 5.0接口。