谷歌AI全家桶深夜爆更:Gemini 3.5新王登場,數十億人搜索變天,AI眼鏡終於來了

智東西
05/20

智東西

作者 | 程茜 陳佳

編輯 | 雲鵬

智東西5月20日報道,今日凌晨,在一年一度的谷歌I/O開發者大會上,谷歌接連甩出2款新模型、谷歌搜索25年最大升級、Claude Code谷歌版開發平台Antigravity 2.0、AI眼鏡等多個大招!

谷歌CEO桑達爾·皮查伊(Sundar Pichai)稱,這次谷歌I/O大會的新發布,意味着其已正式邁入智能體驅動的Gemini時代。皮查伊一開場就放出了自己形象生成的AI視頻,暗戳戳秀了一波自家AI能力。

1、新發2款大模型:可基於任意輸入形式、生成各類模態輸出內容的全能模型Gemini Omini,其首款模型Gemini Omni Flash將率先支持視頻輸出;谷歌最新、最強旗艦模型Gemini 3.5 Flash亮相,每秒輸出token數是OpenAI、Anthropic模型的4倍

2、開發平台Google Antigravity升級:谷歌基於Gemini 3.5 Flash升級了Google Antigravity、Gemini App上的全天候個人智能體Gemini Spark、谷歌搜索,其宣佈此次是谷歌搜索25年來最大更新

3、谷歌官宣AI眼鏡新進展:聯合三星展示了由眼鏡品牌Gentle Monster和Warby Parker共同設計的兩款新眼鏡。谷歌純音頻AI眼鏡將在今年晚些時候率先推出,帶顯示屏的版本將在明年推出。

4、其他大招:Gemini App中的日報智能體Daily Brief、購物中心智能體Universal Cart、 AI圖像創建和編輯工具Google Pics、Google Flow智能體等。

發布會開場,皮查伊官宣了幾組數據:一年時間,谷歌旗下各類業務平台每月處理token暴漲7倍,突破3200萬億token。目前每月有超過850萬開發者利用谷歌的模型開發新應用和新體驗,模型API目前每分鐘處理大約190億token,過去12個月有超過375名谷歌雲客戶各自處理了超過一萬億token

產品的用戶量方面,如今谷歌有13款產品的用戶超過10億,其中5款用戶超過30億;AI Overviews現在擁有超過25億月活躍用戶,僅一年時間,谷歌搜索AI Mode的月活躍用戶就已突破10億;Gemini應用的月活躍用戶已突破9億,每日請求增長了七倍以上;Nano Banana圖像生成模型已生成超過500億張圖像。

在資本支出上,谷歌今年的資本支出將達到2022年的約6倍,約為1800億至1900億美元(約合人民幣1.2萬億至1.3萬億元),這項投資的關鍵部分就是谷歌TPU。谷歌還特地為TPU製作了動畫短片。

本屆谷歌I/O大會依舊信息量爆棚,智東西帶你一文看盡。

一、全能模型Omni亮相,自然語言對話就能改視頻

谷歌推出全新模型系列Gemini Omni,可依託任意輸入內容生成各類內容,目前其率先支持視頻輸出,未來會支持圖像、文本輸出。

谷歌Omni家族的首款模型是Gemini Omni Flash,用戶可以在Gemini應用、Google Flow和YouTube Shorts上試用。谷歌將在未來幾周通過API向開發者和企業客戶推廣。

首先用戶可以通過對話進行視頻剪輯,例如重塑視頻中的環境,通過微調細節或者以現有視頻為藍本,打造出用氣泡做雕塑等現實情況無法實現的視頻內容。

Omini還能對視頻中的動作、物品進行修改。谷歌DeepMind CEO戴密斯·哈薩比斯(Demis Hassabis)在現場演示了Omini的效果,其修改提示詞為:全程保留原視頻所有畫面與敘事,僅在4.3秒男子手指觸碰鏡面的瞬間觸發特效:鏡面以指尖為圓心,泛起液態水波紋般的漣漪;房間整體環境瞬間暗化;海量可自主變形、具備照片級真實質感的多幾何造型3D棱鏡,同時佈滿整個房間空間。

其次,Omni還能結合世界知識推演視頻的後續情節走向,例如其能理解重力、流體力學等物理概念,創造出彈珠快速滾動的流暢鏡頭。

此外,其還能通過簡短的提示,生成更為複雜的內容,例如用黏土動畫解說蛋白質摺疊的概念。

最後,其能將用戶輸入的圖像、文本、視頻、音頻等任意參考內容,生成一個統一的視頻。不過目前其只支持語音類參考素材,後續很快會上線其他類型音頻輸入能力。例如當用戶上傳角色、場景、音頻素材,Omini就會生成對應的視頻效果。

二、Gemini 3.5系列來了,Flash版性能拉滿,Pro下月發

谷歌還推出了Gemini 3.5系列首款模型Gemini 3.5 Flash,擅長複雜且具備實際實用價值的長期任務。皮查伊透露,他們內部顯示Gemini 3.5 Pro的體驗效果很好,下個月會發布。

Arena AI的評測結果顯示,Gemini 3.5 Flash在性能、速度、成本等方面已經全面超越Gemini 3 Flash和Gemini 3.1 Pro。

目前,Gemini 3.5 Flash已經在Gemini App、谷歌搜索的AI Mode中集成。

從基準測試來看,Gemini 3.5 Flash在多個維度上可提供媲美旗艦模型的性能,在Terminal-Bench 2.1(76.2%)、GDPval-AA(1656 Elo)和 MCP Atlas(83.6%)等具有挑戰性的編碼和代理基準測試上,表現優於Gemini 3.1 Pro,並在多模態理解方面領先。在每秒輸出token數方面,是其他前沿模型的4倍。

谷歌一直在使用Gemini 3.5 Flash,配合開發平台Antigravity的模型,皮查伊將這一新模型稱作谷歌內部遊戲規則的改變,這大大加快了我們的構建速度。

Gemini 3.5 Flash結合Antigravity可以根據動態標準自動重命名文件和分類

他舉例稱,如果公司能混合使用Gemini 3.5 Flash和其他前沿模型,可以節省大量資金,公司每天處理約1萬億token,如果他們將80%的工作負載從其他前沿模型轉移到3.5 Flash上,每年將節省超過10億美元。

具體功能上,Gemini 3.5 Flash能快速規劃、構建和迭代,幫用戶完成開發新應用、維護代碼庫、協助準備財務文件等任務。

三、2款AI眼鏡上新,不掏手機就能發短信、聽導航、拍照

谷歌AI眼鏡全新升級,其發布了聯合眼鏡品牌Gentle Monster和Warby Parker的2款新AI眼鏡,還增加了獲取導航、發送短信、拍照等功能,且全程無需用戶掏出手機。

AI眼鏡軟件方面的更新包括:

詢問看到的內容:用戶佩戴谷歌AI眼鏡時,可以詢問Gemini眼前看到的景象,如查找路過餐廳的評價、快速解讀交通標識等。

導航:AI眼鏡會知道用戶站在哪裏、面向哪個方向,然後給出自然的、更符合當下情況的導航路線。Gemini還能根據用戶的喜好添加停靠點或附近餐廳。

免提通話:用戶無需觸碰手機,就能接聽管理通話、發送消息,還可讓Gemini匯總未讀信息,也能點播貼合當下氛圍的音樂。

拍照修圖:用戶只需一句語音指令,即可完成拍攝,還能借助Nano Banana模型剔除畫面多餘雜物,或是進行快速修圖。

翻譯:AI眼鏡支持實時語音翻譯,並且發音語氣、音調都貼合說話人原聲,也可直接識別菜單、標牌上的文字,一鍵收聽譯文讀音。

智能代辦:Gemini可在後台自動處理多步驟任務,無需掏出手機,它就能幫你在外賣平台下單咖啡,用戶只需最後確認訂單即可。

與手機應用靈動:用戶可以僅憑語音操作手機軟件,例如呼叫Uber、學習外語等,並且這款AI眼鏡同時適配安卓與蘋果手機。

四、全新AI搜索框上線,自動幫你梳理提問思路

谷歌搜索迎來了25年來最大升級,其推出了全新的智能AI搜索框。今日,其宣佈將Gemini 3.5 Flash作為谷歌搜索AI Mode的默認模型。

谷歌搜索更新重點在於搜索框,據谷歌介紹,其能依託AI智能提示幫用戶梳理提問思路,功能遠超普通自動補全,還支持多模態搜索,用戶可將文字、圖片、文件、視頻乃至瀏覽器標籤頁作為檢索輸入。

此外,用戶還能在谷歌搜索中創建和管理多個AI智能體來完成任務。信息智能體會隨時瀏覽網絡上的一切,如博客、新聞網站和帖子以及實時的金融、購物和體育信息,以監控與用戶具體問題相關的變化。

例如用戶在找公寓,智能體會根據用戶的所有具體需求持續掃描,並在房源符合用戶需求時通知用戶;或者如果用戶想知道喜歡的職業運動員什麼時候宣佈推出球鞋合作,智能體會實時瀏覽互聯網的消息並即使通知。信息智能體將於今年夏天率先為Google AI Pro和Ultra訂閱用戶上線。

此外,谷歌還在擴展谷歌搜索的智能體預定功能,如用戶給出周五晚上找到一個六人私人卡拉OK房間,且晚點供應食物的具體需求,智能體就會匯總最新價格和可用性,並附帶鏈接,讓用戶進行選擇。

谷歌搜索還能基於Antigravity定製化應用。其可以根據用戶的具體問題實時構建定製的可視化工具和模擬,在底層理解用戶查詢內容設計佈局,決定構建哪些自定義組件,然後部署代碼生成交互式視覺效果。

可以看出,從搜索智能體到編程,谷歌正在通過智能體徹底改變用戶使用搜索的習慣。

五、Gemini裏有了全天在線的個人智能體,訂閱計劃新增100美元月費

智能體驅動的開發平台Antigravity升級,以管理和部署能夠跨關鍵開發界面集成的智能體。

其推出了獨立桌面應用Antigravity 2.0,該應用能作為智能體交互的中心平台,允許開發者協調多個智能體並行執行任務,它還具備動態子智能體支持並行工作流程、後台自動化的定時任務以及跨 Google AI Studio、Android和Firebase的生態系統集成。

與此同時,Antigravity能幫助開發者從0開始構建一個可用的操作系統,其谷歌IO大會提到,花了12小時,93名智能體並行工作,處理了15000多次模型請求,處理了2.6btokens,API credits消耗不到1000美元。從內核到進程和內存管理系統,antigravity編寫了每一行代碼。

與此同時,谷歌還更新了訂閱計劃,其推出100美元/月的AI Ultra計劃,Google Antigravity的使用限額是Google AI Pro計劃的5倍。限時內,其為新舊Google AI Ultra訂閱者提供100美元的 Antigravity獎勵積分,若達到計劃配額上限即可生效。用戶只需在Antigravity應用中領取優惠,該優惠將於2026年5月25日到期。

谷歌還為其Gemini App推出新個人AI智能體Gemini Spark。該智能體基於Gemini 3.5 Flash,採用Antigravity調度架構,即使用戶關閉筆記本電腦也能在後台持續運行。谷歌今天開始向可信賴的測試用戶推廣Gemini Spark,計劃下周將Beta版推送到美國的Google AI Ultra訂閱用戶中。

基於Gemini Spark,用戶可以設定定期任務,如自動解析每月信用卡賬單;引導該智能體查看收件箱獲取孩子學校的最新動態,並將綜合每日摘要發送給用戶等;還能綜合郵件和聊天的原始會議記錄,製作文檔、起草郵件。

此外,在安卓設備上,用戶可以通過一個名為Android Halo的新界面空間,查看像Spark這樣的智能體的實時更新和任務進度,該界面將於今年晚些時候推出。

此外,谷歌正在更新macOS的Gemini App。今年夏天,其計劃將Gemini Spark帶到Gemini桌面App中,以幫助用戶處理涉及本地文件的任務並自動化桌面上的工作流程。

其還將為macOS的應用增加語音功能,根據用戶螢幕上的上下文,Gemini可以將用戶語音轉化為草稿,或捕捉光標所在位置。

六、多個全新智能體亮相,還支持語音直出文檔

谷歌還推出了多個AI升級。

Gemini App中上線了開箱即用的智能體Daily Brief,為用戶提供個性化摘要,並綜合收件箱、日曆和任務中的信息找出重要事項,其還可以幫用戶進行優先排序、組織並建議下一步。

Google Flow面向全體用戶推出全新智能體,新智能體可結合用戶指令規劃並邏輯拆解各類複雜任務。用戶能直接在Flow裏編寫創意工具代碼,比如視頻特效設計、手繪動畫製作、文字分層排版等實用工具。

谷歌依託最新Nano Banana模型打造了全新AI圖像創作編輯工具谷歌Pics。無論從零空白創作設計,還是編輯現成照片,Pics都會將畫面裏每一處元素視作獨立對象,而非扁平化靜態圖片。用戶可以進行創作、替換、精修局部細節。目前該工具已面向內測用戶開放,今年夏季晚些時候,將逐步面向谷歌辦公套件內的AI專業版及旗艦版訂閱用戶上線。

谷歌推出全新的購物中心Universe Cart,當用戶將商品添加進去,購物車就會自動開始工作,自動幫你比價、找優惠,還會提醒到貨。

還有一項功能是Docs Live,其可以幫助用戶用聲音直接創建並編輯新文檔,全部用你的語音。Docs Live將於今年夏天向訂閱者推出,語音功能也將加入Gmail和Keep版本。

谷歌深度僞造識別工具SynthID水印增加了跨產品內容憑證驗證功能,這將顯示內容的來源是AI還是攝像頭,以及是否經過生成式AI工具編輯,其已經將內容憑證和SynthID驗證擴展到谷歌搜索和瀏覽器中。英偉達、OpenAI、Eleven Labs將採用SynthID功能。

在科學研究方面,Gemini for Science彙集了Gemini、Deep Think和Deep Research多種AI工具,助力加速科學研究,將像Google Antigravity這樣的平台與30多個主要生命科學數據庫和工具進行了連接。

結語:算力、模型到終端通喫,谷歌AI生態全面爆發

過去一年,谷歌母公司Alphabet的股價上漲了140%,雲業務增長速度甚至超過亞馬遜微軟,華爾街也將Alphabet視為少數能夠從生成式AI繁榮的每一層利潤中都獲利的公司之一。

Plexo Capital創始管理合夥人、Anthropic早期投資者Lo Toney曾在接受外媒採訪時提到,「谷歌可能是最適合大規模變現AI的公司,因為它幾乎掌控了整個技術棧的每一層。」

此番谷歌I/O大會從Gemini 3.5、Gemini Omni系列全新模型迭代升級,到Gemini Spark智能體、AI智能搜索,再到AI眼鏡等端側硬件的密集新品發布證明,谷歌完成了從底層TPU算力基建、前沿大模型到搜索服務、移動終端全場景應用的全線貫通,將其自上而下的垂直整合優勢展現得淋漓盡致。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10