在美國亞利桑那州鳳凰城舉辦的Tech Tour活動上,Intel不但公佈了代號「Panther Lake」的新一代酷睿Ultra處理器的架構技術細節,還首次介紹了代號「Clearwater Forest」的新一代至強處理器,正式命名為「至強6+」系列,同樣是Intel 18A工藝。
我們知道,Intel從至強6開始,更改了全新的命名,不再叫做「至強可擴展處理器」,但依然延續了已有的代際命名。
更重要的是,至強6家族開始兵分兩路:
一是至強6000P系列,採用P核設計、面向計算密集型負載,首批產品代號Granite Rapids;
二是至強6000E系列,採用E核設計、面向高密度計算,首批產品代號Sierra Forest。
Clearwater Forest從名字就能看出是Sierra Forest的繼任者,同樣是純E核設計,但是在工藝和架構方面都進行了重大升級,只是沒有如猜測中命名為至強7系列,而是很保守地取名至強6+系列,意在強調和至強6家族的延續性、兼容性。
Granite Rapids的後繼者則是代號「Diamond Rapids」,將在後續跟進。
Clearwater Forest自然也是Chiplets芯粒設計,而且更加複雜。
至強引入芯粒設計的開端是第四代Sapphire Rapids,但只有一種模塊,計算、I/O單元仍然集成在一起,Intel 7工藝,通過EMIB連接封裝。
第五代Emerald Rapids只是一次小幅升級,工藝、架構都沒變。
第六代Granite Ridge/Sierra Forest改成了一個或多個計算模塊加兩個IO模塊,工藝分別為Intel 3、Intel 7,還有多個EMIB 2.5D技術的連接封裝模塊,這也是Intel 3工藝此前唯一的產品。
Clearwater Forest更進一步,分割成最多12個Intel 18A工藝的計算模塊、最多3個Intel 3工藝的有源基礎模塊,從而實現更多核心、更大緩存等更強大的規格。
同時,它重複使用了來自至強6系列的Intel 7工藝的I/O模塊、EMIB 2.5D連接封裝模塊,甚至數量都一樣。——AMD處理器的IOD模塊有時候就一模一樣。
這正是芯粒設計的最大好處,不需要升級的模塊可以在不同產品中重複使用,從而大大降低研發和製造成本,而在需要升級的時候甚至可以單獨更換。
計算模塊部分最多有3個,每個模塊內部又分為6個模組,而每個模組由4個E核組成,總計最多288個核心(288線程)。
這種四個為一組的方式和消費級的酷睿處理器上一模一樣。
至強6000E系列雖然也能做到288核心,但那屬於定製產品,公開路線圖產品最多是144核心。
更進一步,至強6+還支持單路、雙路並行,單系統可以做到最多576個核心。
E核架構也是Darkmont,和Panther Lake處理器上一模一樣。
二級緩存也是每4個E核共享4MB(相當於每個核心1MB),總計多達288MB。
那麼,三級緩存呢?
原來在這裏。
基礎模塊不再是單純的連接作用,而是承載了三級緩存、內存控制器。
一個基礎模塊可以承載四個計算模塊,而每個計算模塊對應48MB三級緩存,每個基礎模塊就是192MB,合計最多576MB。
在不考慮一級緩存的情況下,一顆Clearwater Forest處理器就有多達864MB緩存!不知道這是不是Intel大緩存消息的根源?
DDR5內存控制器每個基礎模塊有四個,組成四通道,合計就是12通道。
I/O模塊和上代一模一樣,自然規格也沒變,每一個裏邊有8個加速器、48條PCIe 5.0通道、32條CXL 2.0通道、96條UPI 2.0鏈路,總量乘以二就是了。
Clearwater Forest的另一個重點,就是首發量產了全新的Foveros Direct 3D封裝技術,將計算模塊與基礎模塊連接在一起,而基礎模塊、I/O模塊與封裝基底的連接則採用了EMIB。
它採用了非常先進的銅-銅鍵合技術,凸點間距只有9微米,凸點密度超過每平方毫米1萬!
要知道,Panther Lake處理器使用的Foveros-S 2.5D,凸點間距為36微米,這就差了足足4倍。
想一想,在區區1平方毫米的空間內,就有上萬個這樣的連接,該有多麼複雜、精密!
再加上有源硅中介層的配合,可以實現不同Die之間超高帶寬、超低功耗、超低電阻的連接,而且能效比極為出色,傳輸每個比特的功耗只有大約0.05皮焦耳——1皮焦耳等於1萬億分之一焦耳。
直觀地比較一下,手機芯片一個指令週期的能耗就是幾納焦耳,而皮焦耳是納焦耳的千分之一!
性能方面,Intel只提供了一些架構層面的數據,號稱至強6+系列對比至強6780E 144核心可提升最多90%,能效提升最多23%。
對比古老的二代至強,至強6+可以將機架空間縮小到1/8,而得益於能效的3.5倍飛躍,還可以節省750千瓦的能耗。
總結一下Clearwater Forest的主要特點:
支持單路、雙路並行,向下兼容至強6900P系列(接口都是LGA7529)。
最大熱設計功耗300-500W。
最多288核心、288MB二級緩存、576MB三級緩存。
12通道DDR5內存,最高頻率800MT/s。
最多6條UPI 2.0(每通道帶寬24GT/s)、96條PCIe 5.0(可拆分為x16/x8/x4/x2)、64條CXL 2.0。
最多16個集成加速器,包括4個QAT、4個DLB、4個DSA、4個IAA。
支持AVX 2指令集(VNNI/INT8)——還是沒有AVX-512。
支持SGX、TDX安全擴展。
Clearwater Forest對比至強6700E系列,提升可以說是全方位的:
核心增加1倍,IPC性能提升17%,三級緩存增加4.3倍,內存通道增加50%,UPI 2.0連接增加50%,內存頻率提升25%。