摘要:
Grok 4目前是地表最強AI,但也是地表最貴AI。能不能突破AI與物理世界的連接就看它了。
鳳凰網科技 出品
作者|董雨晴
北京時間7月10日中午12時左右,馬斯克旗下xAI公司推出的Grok-4系列模型終於發佈。只是開始的比原定計劃時間整整晚了一個小時。
直播一開場,馬斯克就搬出一句熟悉的臺詞:“這是世界上最好的AI,讓我們來展示一下”。只不過最豪邁的發言搭配的發佈形式“略顯潦草”,有觀看直播的網友吐槽,“老馬滿臉疲憊”。
馬斯克特別表示,在學術問題上,Grok 4能在所有學科中達到甚至超越人類博士水平。他還特別自信地預測,Grok 4有望在今年內爲人類帶來“發現新科學技術”的突破,並可能在明年發現新的物理現象。
根據規劃,xAI還將在8月發佈編程模型,9月發佈多模態智能體,10月發佈視頻生成模型。
Grok-4到底有多強?比最強(SOTA)更強
在多項嚴苛的基準測試中,Grok 4都堪稱領先。在被稱爲“人類最終考試”的HLI(Humanities Last Exam)基準中,該模型在未使用工具的情況下解決了25%的問題。
而其多智能體版本Grok 4Heavy,通過並行協作,多一點時間思考,進一步將文本子集問題的解決率提升至超過50%,也是所有模型中首次突破這一數值的。
此外,Grok 4還在包括PhD級別問題集在內的所有推理基準測試中表現出色,甚至在編碼基準和數學競賽中取得了滿分,通常比第二名模型有顯著領先。
xAI方面介紹,本次發佈能夠實現遠超各類SOTA的成績,本質上是範式和計算量的躍遷。
與Grok 2相比,Grok 4訓練量增加了100倍,並且還在持續擴張。特別是在推理和強化學習(RL)方面,Grok 4投入了大量計算資源,其RL計算量是其他任何模型的10倍以上。
要知道在AI領域,xAI一直以“豪”著稱,擁有包含10萬塊H100 GPU的“世界超級計算機”。Grok 2在12個月前還只是一個概念,而如今的標準下,Grok 2的模型智能水平已相當於高中生。
目前,Grok 4的訂閱費是30美元/月,Grok 4 Heavy的費用爲300美元/月,Grok 3維持免費狀態。換算下,最貴的Heavy年費直逼2.1萬元人民幣了。
除了基礎模型能量的大幅提升外,xAI還公佈了Grok語音模式的大升級,端到端延遲降低一半,並引入了多款更自然、富有情感的新聲音,例如具有史詩般低沉聲線的Sal和能表達豐富情感的英倫女聲Eve。
儘管Grok 4在多模態理解(特別是圖像理解和生成)方面仍存在“部分盲點”,但xAI表示,其基礎模型的第七個版本(計劃在幾周內完成訓練)將解決這一弱點,未來模型將能夠像人類一樣“聽到和看到世界”。
在Google等已經取得顯著突破的視頻生成領域,xAI也緊咬不放,稱正在推進模型的訓練,預計今年將出現首部可觀看的AI生成電視節目片段,明年有望出現首部AI電影。