學術能力超博士,馬斯克的Grok 4來了

投資界
07-10

原標題:學術能力超博士,馬斯克的Grok 4來了 來源:鳳凰網

北京時間7月10日中午12時左右,馬斯克旗下xAI公司推出的Grok-4系列模型終於發佈。只是開始的比原定計劃時間整整晚了一個小時。

直播一開場,馬斯克就搬出一句熟悉的臺詞:“這是世界上*的AI,讓我們來展示一下”。只不過最豪邁的發言搭配的發佈形式“略顯潦草”,有觀看直播的網友吐槽,“老馬滿臉疲憊”。

馬斯克特別表示,在學術問題上,Grok 4能在所有學科中達到甚至超越人類博士水平。他還特別自信地預測,Grok 4有望在今年內爲人類帶來“發現新科學技術”的突破,並可能在明年發現新的物理現象。

根據規劃,xAI還將在8月發佈編程模型,9月發佈多模態智能體,10月發佈視頻生成模型。

Grok-4到底有多強?比最強(SOTA)更強

在多項嚴苛的基準測試中,Grok 4都堪稱*。在被稱爲“人類最終考試”的HLI(Humanities Last Exam)基準中,該模型在未使用工具的情況下解決了25%的問題。

而其多智能體版本Grok 4Heavy,通過並行協作,多一點時間思考,進一步將文本子集問題的解決率提升至超過50%,也是所有模型中首次突破這一數值的。

此外,Grok 4還在包括PhD級別問題集在內的所有推理基準測試中表現出色,甚至在編碼基準和數學競賽中取得了滿分,通常比第二名模型有顯著*。

xAI方面介紹,本次發佈能夠實現遠超各類SOTA的成績,本質上是範式和計算量的躍遷。

與Grok 2相比,Grok 4訓練量增加了100倍,並且還在持續擴張。特別是在推理和強化學習(RL)方面,Grok 4投入了大量計算資源,其RL計算量是其他任何模型的10倍以上。

要知道在AI領域,xAI一直以“豪”著稱,擁有包含10萬塊H100 GPU的“世界超級計算機”。Grok 2在12個月前還只是一個概念,而如今的標準下,Grok 2的模型智能水平已相當於高中生。

目前,Grok 4的訂閱費是30美元/月,Grok 4 Heavy的費用爲300美元/月,Grok 3維持免費狀態。換算下,最貴的Heavy年費直逼2.1萬元人民幣了。

除了基礎模型能量的大幅提升外,xAI還公佈了Grok語音模式的大升級,端到端延遲降低一半,並引入了多款更自然、富有情感的新聲音,例如具有史詩般低沉聲線的Sal和能表達豐富情感的英倫女聲Eve。

儘管Grok 4在多模態理解(特別是圖像理解和生成)方面仍存在“部分盲點”,但xAI表示,其基礎模型的第七個版本(計劃在幾周內完成訓練)將解決這一弱點,未來模型將能夠像人類一樣“聽到和看到世界”。

在Google等已經取得顯著突破的視頻生成領域,xAI也緊咬不放,稱正在推進模型的訓練,預計今年將出現首部可觀看的AI生成電視節目片段,明年有望出現首部AI電影。

另有用戶已經發現,特斯拉最新固件裏已經偷偷加上了Grok的全功能版本,就差激活了。未來,xAI還設想Grok與特斯拉Optimus類人形機器人結合,通過與現實物理世界的互動,將能更深層次地驗證假設,推動AI能力的最終飛躍。

寫在最後

這次發佈會還都是老面孔,比如Yuhuai Wu(吳宇懷),本次發佈會右二,作爲xAI的聯合創始人,上一次Grok3發佈的時候就已經引起國內注目了。

他在2021年博士畢業於多倫多大學機器學習專業,博士期間曾在 Deepmind和 OpenAI實習,同時也在斯坦福做博士後研究。坐在他左邊的是他在多倫多大學的老師,也是xAI核心成員吉米·巴(Jimmy Ba)。

從創立之初xAI的華人含量就不低,聯合創始人Greg Yang(楊格),出生於湖南,初中開始前往美國學習,本科和碩士學位都在哈佛大學數學系攻讀。楊格的履歷十分豐富,與蘋果谷歌高通英偉達都曾有過關聯。2018年,Greg Yang獲得了本科生數學領域的最高榮譽Morgan Prize,之後加入了微軟雷蒙德研究院,任高級研究員。

目前,據社交網絡上分享的圖片,xAI的華人工程師含量已經快接近一半了。

海量資訊、精準解讀,盡在新浪財經APP

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10