谷歌安卓桌面版重構鼠標光標交互,讓AI聽懂「這個/那個」比劃

IT之家
05/13

5 月 13 日消息,在今天凌晨舉辦的 2026 年 The Android Show | I/O Edition 活動結束後,谷歌 DeepMind 發布博文,詳細介紹了適用於 Googlebook 的 Magic Pointer 功能。

定位方面,Magic Pointer 是光標交互功能,不只識別「指到了什麼」,還要理解「為什麼這對用戶重要」。該功能的核心目標是儘量不打斷原有操作流,讓 AI 主動進入用戶當前使用的工具和頁面。

其理念是用「更簡單、更直觀的交互方式」取代「文字過多的提示」。

谷歌在博文中指出,當前大部分 AI 工具都停留在獨立界面中,用戶常常需要把網頁、文檔、圖片或數據複製、拖拽到 AI 窗口裏,再輸入完整提示詞。

這種使用方式會打斷工作節奏,新方案希望反過來,讓 AI 直接出現在用戶正在使用的工具裏,依據指針位置和語音命令理解上下文。

DeepMind 總結了 4 條核心原則:

第 1 條是「保持工作流」,即 AI 能力應覆蓋各類應用場景,例如指向 PDF 後要求生成要點摘要並粘貼進郵件,懸停統計表格後要求生成餅圖,選中菜譜後要求把全部配料翻倍。

第 2 條是「邊指邊說」,通過捕捉指針周圍的視覺與語義信息,讓系統知道用戶究竟想處理哪個詞、哪段文字、哪塊圖片或哪段代碼。

第 3 條強調「這個」「那個」的自然表達方式。人與人交流時,本就依賴手勢和共享語境,不必每次都說完整長句。若 AI 能同時理解上下文、指向動作和語音,用戶只需說「改一下這個」或「把那個移到這裏」,也能發出複雜請求。

第 4 條原則則是把像素轉化為可操作實體,比如地點、日期、物體等,從而讓一張潦草便籤變成交互式待辦清單,讓旅行視頻中的餐廳畫面直接對應預訂鏈接。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10