(信息來源:WSJ)
“我實在搞不明白。”在硅谷從事數據中心和硬件工作已有30年的安德魯·韋(Andrew Wee)如是說。
讓他如此困惑——甚至憤怒的“這件事”,是未來AI超級計算機所預測的龐大能耗,而這些超級計算機正被認爲將推動人類邁向新的躍進。韋曾在蘋果和Meta擔任高級職位,如今是雲服務提供商Cloudflare的硬件負責人。他認爲,當前AI所需能源的增長速度——據世界經濟論壇估計,到2030年每年增長50%——是無法持續的。
“我們必須找到技術解決方案、政策解決方案,乃至其他解決辦法,共同應對這一問題。”他說。
爲了實現這一目標,韋在Cloudflare的團隊正測試一種激進的新型芯片,這款芯片來自2023年成立的一家初創公司Positron。該公司剛剛完成了一輪5160萬美元的新融資。這種芯片在AI推理任務上——也就是AI根據用戶輸入生成響應的過程——比行業領先者英偉達的芯片更具能效優勢。儘管在可預見的未來,英偉達的芯片仍將在AI訓練階段佔據主導地位,但如果推理階段的能效提升,可能爲企業節省數百億美元的成本和相應的能源開支。
如今,至少有十幾家芯片初創企業正努力向雲計算服務商銷售爲AI推理量身打造的芯片。此外,谷歌、亞馬遜和微軟也在投入巨資、持續多年打造自家的推理專用芯片,既用於內部AI系統,也面向外部客戶提供雲服務。
這些努力的激烈程度以及累積的投入規模表明,幾乎每一家科技巨頭——以及許多初創公司——都急於在不支付“英偉達稅”的情況下,爲消費者和企業提供AI服務。所謂“英偉達稅”,是指英偉達約60%的硬件毛利率,也就是購買該公司硬件所需的溢價成本。
英偉達深知推理環節的重要性與AI能耗問題日益引發關注。公司高級總監迪昂·哈里斯(Dion Harris)表示,他負責向英偉達的主要客戶推介最新AI硬件。他補充說,英偉達最新的Blackwell系統在推理任務上的能效,是上一代產品的25到30倍。
專用化浪潮
爲了達成目標,那些新興AI芯片製造商採取了反覆奏效的策略:從頭開始設計芯片,專爲突然間變得至關重要的新型任務而打造。過去是圖形處理成了熱點,也正是英偉達從中發跡。之後人們才發現圖形芯片可被用於AI任務,但從根本上說,它們並不完美適配AI。
Jonathan Ross 是芯片初創公司 Groq 的首席執行官,曾負責谷歌的AI芯片開發計劃。他表示創立Groq(與Elon Musk的xAI聊天機器人無關)是因爲他相信AI芯片有一種全然不同的設計方式——專門爲當今的AI模型而生。
Groq聲稱,其芯片運行AI的速度遠超英偉達頂級產品,所需功耗僅爲英偉達的三分之一到六分之一。這歸功於其獨特設計,即將內存嵌入芯片之中,而非作爲獨立組件。雖然Groq芯片的具體性能受諸多因素影響,但其在推理成本方面優於英偉達的說法是可信的,分析機構SemiAnalysis的分析師、曾在惠普企業工作十年的喬丹·納諾斯(Jordan Nanos)表示。
Positron 走的是另一條提高推理效率的路線。這家公司已向包括Cloudflare在內的客戶交付了芯片,其設計理念是簡化芯片功能,專注於更窄的任務範圍,從而實現更快的運行速度。其最新融資輪由Valor Equity Partners、Atreides Management和DFJ Growth參投,使得總融資額達到7500萬美元。
Positron的下一代系統將與英偉達下一代系統 Vera Rubin 競爭。Positron首席執行官米特什·阿格拉瓦爾(Mitesh Agrawal)表示,根據英偉達的產品路線圖,Positron芯片的單位成本性能將是英偉達的兩到三倍,單位電力性能將是其三到六倍。
英偉達的哈里斯回應稱,許多競爭者宣稱在推理性能上超越英偉達,但這往往忽視了客戶在選擇硬件時所考慮的各種因素。他指出,靈活性也很關鍵,尤其是隨着新AI模型和新用例的不斷湧現,企業對芯片的用途也在快速變化。“英偉達的客戶未必會被那些適用於小衆推理應用的芯片所打動。”他說。
Cloudflare對Positron芯片的初步測試結果令人鼓舞,足以讓韋決定將其部署到公司數據中心進行更長期測試。他表示,只有另一家芯片初創企業曾達到過這個標準。“如果他們真能兌現其承諾的性能指標,我們會全力放開採購閥門,讓他們在全球大規模部署。”他說。
韋認爲,通過讓AI硬件實現“商品化”,並讓英偉達的客戶能夠轉向更高效的系統,市場競爭的力量或許能改變AI未來能耗不斷攀升的趨勢。“現在整個行業都處於FOMO(錯失恐懼)狀態,但我相信,最終理性會趕上現實。”他說。
一個不變的真理是:計算行業的發展歷史一再表明,每當硬件工程師找到更快、更高效的方法時,軟件開發者和消費者總會迅速將所有性能提升用盡,甚至超額使用。
馬克·洛邁耶(Mark Lohmeyer)是Google Cloud的AI與計算基礎設施副總裁,他的團隊既提供谷歌自研AI芯片,也提供英偉達芯片,服務對象包括谷歌自身和其雲客戶。他表示,隨着消費者和企業採用更復雜、要求更高的AI模型,無論AI交付效率提升多少,整體需求的增長依然看不到盡頭。與幾乎所有AI巨頭一樣,谷歌也在努力探索激進的新型能源方案,以滿足AI所需,包括核能與核聚變。
關鍵在於:雖然新芯片或許能幫助個別公司更高效地交付人工智能,但整個行業仍然會消耗越來越多的能源。正如 Anthropic 最近的一份報告指出的那樣,這意味着能源生產,而不是數據中心和芯片,纔是未來人工智能發展的真正瓶頸。