
摘要:
Grok 4目前是地表最強AI,但也是地表最貴AI。能不能突破AI與物理世界的連接就看它了。
鳳凰網科技 出品
作者|董雨晴
北京時間7月10日中午12時左右,馬斯克旗下xAI公司推出的Grok-4系列模型終於發布。只是開始的比原定計劃時間整整晚了一個小時。
直播一開場,馬斯克就搬出一句熟悉的台詞:「這是世界上最好的AI,讓我們來展示一下」。只不過最豪邁的發言搭配的發布形式「略顯潦草」,有觀看直播的網友吐槽,「老馬滿臉疲憊」。

馬斯克特別表示,在學術問題上,Grok 4能在所有學科中達到甚至超越人類博士水平。他還特別自信地預測,Grok 4有望在今年內為人類帶來「發現新科學技術」的突破,並可能在明年發現新的物理現象。
根據規劃,xAI還將在8月發布編程模型,9月發布多模態智能體,10月發布視頻生成模型。

Grok-4到底有多強?比最強(SOTA)更強
在多項嚴苛的基準測試中,Grok 4都堪稱領先。在被稱為「人類最終考試」的HLI(Humanities Last Exam)基準中,該模型在未使用工具的情況下解決了25%的問題。

而其多智能體版本Grok 4Heavy,通過並行協作,多一點時間思考,進一步將文本子集問題的解決率提升至超過50%,也是所有模型中首次突破這一數值的。
此外,Grok 4還在包括PhD級別問題集在內的所有推理基準測試中表現出色,甚至在編碼基準和數學競賽中取得了滿分,通常比第二名模型有顯著領先。
xAI方面介紹,本次發布能夠實現遠超各類SOTA的成績,本質上是範式和計算量的躍遷。
與Grok 2相比,Grok 4訓練量增加了100倍,並且還在持續擴張。特別是在推理和強化學習(RL)方面,Grok 4投入了大量計算資源,其RL計算量是其他任何模型的10倍以上。
要知道在AI領域,xAI一直以「豪」著稱,擁有包含10萬塊H100 GPU的「世界超級計算機」。Grok 2在12個月前還只是一個概念,而如今的標準下,Grok 2的模型智能水平已相當於高中生。

目前,Grok 4的訂閱費是30美元/月,Grok 4 Heavy的費用為300美元/月,Grok 3維持免費狀態。換算下,最貴的Heavy年費直逼2.1萬元人民幣了。
除了基礎模型能量的大幅提升外,xAI還公布了Grok語音模式的大升級,端到端延遲降低一半,並引入了多款更自然、富有情感的新聲音,例如具有史詩般低沉聲線的Sal和能表達豐富情感的英倫女聲Eve。
儘管Grok 4在多模態理解(特別是圖像理解和生成)方面仍存在「部分盲點」,但xAI表示,其基礎模型的第七個版本(計劃在幾周內完成訓練)將解決這一弱點,未來模型將能夠像人類一樣「聽到和看到世界」。
在Google等已經取得顯著突破的視頻生成領域,xAI也緊咬不放,稱正在推進模型的訓練,預計今年將出現首部可觀看的AI生成電視節目片段,明年有望出現首部AI電影。