Gemini 2.5 Pro登頂三冠王!AI最強編程屠榜,全面碾壓Claude 3.7

新智元
05-07

新智元報道

編輯:犀牛 桃子

【新智元導讀】谷歌Gemini 2.5 Pro(I/O版)橫空出世,強勢登頂LMAreana,斬獲文本、視覺、編碼三連冠,甚至編程能力全面碾壓Claude 3.7,地表最強編碼模型誕生。

AI編程王座,一夜易主。

昨晚,谷歌放出全新升級的Gemini 2.5 Pro Preview(I/O版),一舉拿下三連冠,登頂LMeana。

它成爲首個橫掃文本、視覺、WebDev Arena基準的SOTA模型,編碼性能碾壓Claude 3.7 Sonnet。

不論是在代碼轉換、代碼編輯,甚至是開發複雜的智能體工作流中,Gemini 2.5 Pro都能得心應手。

隨手畫個草圖,Gemini 2.5 Pro即可將其變成一個繪畫小程序。

只需一個提示,它就能將自然圖像,轉化爲代碼來表示獨特的圖案。

一句話用你的狗做一個小遊戲。

Hassabis自豪地表示,只是隨隨便便提升了147分ELO,沒什麼大不了的。

谷歌首席科學家、Gemini的負責人Jeff Dean也連發數條推文來介紹更新後的Gemini 2.5 Pro,足見對其性能的信心。

左右滑動查看

開發者現在可以通過Google AI Studio和Vertex AI在Gemini API中開始使用更新後的Gemini 2.5 Pro進行開發。新模型也已經在Gemini App正式上線,支持Canvas等功能。

任何人都能通過單個提示來編寫代碼和構建交互式Web應用。

史上最強編程模型屠榜

Gemini 2.5 Pro Preview(I/O版)搶先體驗版,是對2.5 Pro的全新升級,特別在編程方面有了大幅提升,尤其擅長打造引人入勝的互動網頁應用。

在視覺基準測試中,Gemini 2.5 Pro Preview憑藉巨大優勢,領先GPT-4o、o3等模型。

在WebDev上,它成爲首個超越Claude的編程模型,甚至連最新發布的GPT-4.1都不及Gemini 2.5 Pro。

從基準測試上看,新版Gemini 2.5 Pro相較於原版得到了全方位的提升。

谷歌在官博上聲稱,本來計劃在谷歌I/O上發佈這個更新,但看到大家對這款模型的熱情高漲,所以決定提前放出,讓所有人能儘早開發使用。

此次更新,除了以UI爲中心的開發外,還擴展到了代碼轉換、代碼編輯和開發複雜的AI智能體工作流。

在博客中,谷歌隨手放了個小實例:一句話將圖片上樹葉的行爲用代碼表達出來。

更新後的Gemini 2.5 Pro在視頻理解方面也擁有頂尖的性能,在VideoMME基準測試中的得分爲84.8%,可以根據單條YouTube視頻生成一個交互式學習網站。

谷歌在博客中還同時給出了與更新前Gemini 2.5 Pro之間的對比視頻。

對於此次更新,AI編程工具Cursor CEO Michael Truell評價道:“我們對最新的Gemini 2.5 Pro感到非常興奮,它在原本就很強大的編碼能力上進一步提升。我們在內部觀察到,新模型在調用工具時的失敗率顯著降低,這一改進相信會讓用戶覺得2.5 Pro在Cursor中的表現比以前更加出色。”

“氛圍編程”王者,全網玩瘋

Gemini 2.5 Pro Preview一經發布,熱度直接爆表。開發者們藉助其強大編碼能力,構建出有趣的demo了。

谷歌大佬曬demo

谷歌研究員JB Alayrac表示,Gemini 2.5 Pro最新升級的代碼能力,簡直絕了。

更驚豔的是,將其編程實力和頂尖多模態視頻理解能力相結合,直接把YouTube視頻轉錄成p5.js動畫。

在谷歌DeepMind研究員Ali Eslami發佈的另一個演示中,用Gemini 2.5 Pro“氛圍編程”芝加哥藝術學院收藏品的3D導覽。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10