OpenAI被曝IMO金牌“造假”,陶哲軒怒揭內幕!

市場資訊
07/21

  炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛力主題機會!

(來源:新智元)

新智元報道

編輯:桃子 好睏

【新智元導讀】OpenAI高調摘下數學金牌,竟是自嗨!組委會內部人士透露,OpenAI不僅未與IMO官方合作,甚至無視賽事規則,在閉幕派對未結束前搶先官宣。全網怒批其不尊重人類選手,炒作過頭。

,最新大瓜又來了。

昨日,因內部審覈流程,。

原來,事情並非那麼簡單。

一位IMO內部人士透露,實際上OpenAI並沒有和組委會合作,拿下AI金牌不一定真實有效。

最關鍵的是,他們違背了IMO規定的“公佈時間”規則。

爲了避免AI公司們搶奪人類學生的風頭,IMO評審團要求:在閉幕式結束一週後再公佈結果。

然而,OpenAI卻在閉幕Party還未結束前,就發佈了結果。

對此,谷歌DeepMind負責人Thang Luong表態,“是的,IMO組委會有一份不對外公開的官方評分標準”。

若未依據該標準進行評估,任何獎牌聲明均無效。

扣除1分後應爲銀牌,而非金牌。

這麼說來,OpenAI聲稱拿下IMO金牌,只是自嗨?!

OpenAI真面目被戳穿

搶奪學生風頭

就在昨天,菲爾茲獎得主陶哲軒在一口氣連發三條評論,暗指的就是OpenAI。

他表示,“自己不會評論任何未預先公開測試方法的AI競賽成績報告。在缺乏受控測試環境的情況下,AI的數學能力難以準確評估”。

另外,IMO組委會一位成員Joseph Myers透露,OpenAI並非是IMO合作測試模型的AI公司之一。

而且,陽光海岸的91位協調員(Coordinator)也無人蔘與結果評估。

P6題協調員表示,“IMO評審團和協調員一致認爲,OpenAI此舉顯得失禮且不妥當”。

根據IMO規定,藉助AI模型參賽的公司,需要在7月28日之後公佈結果。

一家專注於數學AI初創公司Harmonic官方發文,從側面印證了這一規定存在的準確性。

最新回應引熱議

OpenAI研究科學家,德撲之父Noam Brown下場回應,給出了兩點證明:

首先,團隊是在閉幕式“之後”公開結果。閉幕式有直播記錄,這一點很容易覈實。

其次,他確認了OpenAI並未與IMO進行協調,只是在發帖前與一位組織者告知了此事。出於對參賽學生的尊重,要求OpenAI等到閉幕式結束後再發布——“我們也照做了”。

對此,有人還精細計算了閉幕式和公開結果的時間差。

IMO閉幕式的時間在7月19日(當地時間)下午4點舉行閉幕式,直播時間1小時43分鐘,結束時間不晚於5點43分。

再來看負責人Alexander Wei的發文時間,7月19日下午3:50(東八區),也就是當地時間的5點50分。

從時間來看,確實是OpenAI在IMO閉幕式結束7分鐘後,才發佈了公告。

即便如此,網友們仍舊看不慣OpenAI炒作風暴,而且根本沒有給獲獎學生留有餘地。

而且,可以確定的是,OpenAI公佈的結果,並沒有得到IMO官方認證。

未來幾天,谷歌DeepMind會正式發佈AI奪下IMO 2025細節。

馬庫斯憤怒抨擊,太符合品牌調性了。

UCLA數學教授

LLM短期內不會取代人類

針對LLM拿下IMO金牌事件,來自UCLA應用數學教授Ernest Ryu發表了自己的看法。

1. OpenAI IMO P1-P5的解答目測是正確的。

2. 第6題是一個明顯新穎且難度更高的問題。可以說第1-5題仍在“標準”IMO解題技巧範圍內,但第6題需要創造性思維。

他表示,根據自己使用LLM進行數學研究的經驗,Gemini的表現優於ChatGPT。

但OpenAI搶先在週六宣佈了結果,而谷歌DeepMind“慢科研”學術作風,讓他們輸掉了這場公關戰。

不過,Ernest Ryu認爲,在短期內,大模型不會取代數學家。

因爲數學研究是,解決那些目前“沒有人”知道如何解決的問題(訓練數據分佈之外),即類似IMO P6題。這需要極大的創造力,OpenAI的模型在IMO解題中恰恰缺乏這種能力。

然而,對於那些人類已有能力解決的問題(訓練數據分佈之內),LLM只會變得愈加強大。

在數學研究中,人們會將現有技術與新創意相結合,LLM將顯著加速前一部分工作的實現。

Ernest Ryu還預測,在接下來十年裏,越來越多的數學家將藉助LLM來搜索證明框架中的已知部分,從而提升研究效率。

老一輩數學家或許會對此唏噓不已,但年輕一代只會繼續產出優秀成果。

參考資料:

https://x.com/ns123abc/status/1947016206768046452 https://x.com/lmthang/status/1946960256439058844 https://x.com/Mihonarium/status/1947027989608190065

海量資訊、精準解讀,盡在新浪財經APP

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10