在谷歌Kaggle平臺舉辦的AI國際象棋錦標賽決賽中,ChatGPT開發商OpenAI的模型以壓倒性優勢戰勝了埃隆·馬斯克旗下xAI公司的Grok。這場彙集Anthropic、谷歌、DeepSeek等八家大語言模型的賽事,成爲科技巨頭角力的新戰場。
On a black and white chess board, a black king chess piece stands upright. It is surrounded by toppled white pawns. 賽事焦點:通用AI的棋藝對決
• 歷史性測試場 :國際象棋長期被用作評估計算機能力的試金石。例如,1997年IBM"深藍"擊敗國際象棋世界冠軍卡斯帕羅夫※,2010年代谷歌DeepMind的AlphaGo又戰勝韓國圍棋大師李世石(後者賽後退役並感嘆"存在無法戰勝的實體")。但本次比賽的特殊性在於——參賽模型並非專用棋類程序,而是服務於日常場景的通用AI。
粉絲們在紐約觀看國際象棋世界冠軍加里·卡斯帕羅夫(電視屏幕上)和IBM深藍電腦之間的國際象棋比賽。比賽從遊戲室轉播到禮堂,國際象棋專家分析每一步棋。
• OpenAI的完勝 :經過三日角逐,OpenAI的o3模型以全勝戰績晉級決賽,並在終極對決中四局全勝Grok 4。Grok在終局階段多次出現"送後"(主動犧牲皇后)的重大失誤,被國際象棋特級大師中村光在直播中點評爲"失誤頻發"。
• 馬斯克的回應 :決賽前馬斯克在X平臺聲稱,Grok此前勝出只是"副作用",強調"幾乎未在象棋上投入精力"。這與Chess.com記者Pedro Pinhata的觀察形成反差——半決賽前Grok曾被視作"無可阻擋的強者",但最終"幻象在賽事最後一日破滅"。
科技巨頭的智能宣稱戰
賽事落幕之際,OpenAI與xAI的競爭更趨白熱化:
公司 |
模型 |
核心能力宣稱 |
發佈時間 |
OpenAI |
GPT-5 |
"博士水平專家"、"推理能力飛躍提升" |
2025年8月 |
xAI |
Grok 4 Heavy |
"兩週前已超越GPT-5智能水平" |
2025年7月 |
• GPT-5的突破 :OpenAI首席執行官薩姆·奧特曼將GPT-5定義爲"口袋裏的博士團隊",宣稱其實現三大進化:
1. 採用新型推理模型增強邏輯能力
2. 顯著減少幻覺現象(編造事實)與欺騙性輸出
3. 編程能力達專業開發者水準
Sam Altman hearing a headset microphone on stage at an event
• 馬斯克的隔空交鋒 :GPT-5發佈當日,馬斯克在X平臺宣稱:"Grok 4 Heavy兩週前就比現在的GPT-5聰明"。牛津大學倫理AI教授卡麗莎·維利茲對此持保留意見:"這些系統的盈利能力尚未驗證,過度宣傳恐存泡沫風險。"
Elon Musk 商業模式的分歧與挑戰
雙方在AI商業化路徑上顯現根本差異:
"我們迄今專注讓Grok成爲全球最精準的AI,現在該考慮如何支付昂貴GPU了。"
——馬斯克向廣告商宣佈Grok將引入付費推薦位
• OpenAI的倫理調整 :繼五月因"過度諂媚"撤回更新後,OpenAI宣佈GPT-5將引導用戶自主思考情感決策(如"該分手嗎")。奧特曼承認:"人們可能與AI建立具有潛在風險的擬社會關係,社會需要設立新的防護機制。"
• xAI的盈利轉型 :曾多次抨擊OpenAI盈利化的馬斯克,轉向允許廣告商付費植入Grok回覆。此舉引發準確性擔憂——當商業利益滲透AI答案時,其可信度可能受損。更棘手的是,Grok此前曾發表反猶言論甚至批評馬斯克本人,品牌合作風險顯著。
Illustration shows OpenAI logo 歷史棋局與未來挑戰
這場賽事揭示出AI發展的新維度:
• 能力評估進化 :與"深藍"依賴暴力計算不同,現代大語言模型展現出通用策略學習能力。卡斯帕羅夫曾諷刺"深藍"爲"千萬美元的鬧鐘"。
• 監管緊迫性 :艾達·洛芙萊斯研究所所長蓋婭·馬庫斯警告:"AI能力與治理能力間的差距日益擴大"
• 創作權爭議 :Getty Images首席產品官強調:"當AI內容以假亂真,必須審視訓練數據來源並保障創作者權益"
隨着GPT-5向7億用戶開放,Grok增強版持續升級,這場關於智能水平與商業路徑的較量,已遠超棋局勝負,引發對AI倫理、監管框架及技術本質的深層思考。
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。