5 月 13 日消息,在今天凌晨舉辦的 2026 年 The Android Show | I/O Edition 活動結束後,谷歌 DeepMind 發布博文,詳細介紹了適用於 Googlebook 的 Magic Pointer 功能。
定位方面,Magic Pointer 是光標交互功能,不只識別「指到了什麼」,還要理解「為什麼這對用戶重要」。該功能的核心目標是儘量不打斷原有操作流,讓 AI 主動進入用戶當前使用的工具和頁面。
其理念是用「更簡單、更直觀的交互方式」取代「文字過多的提示」。
谷歌在博文中指出,當前大部分 AI 工具都停留在獨立界面中,用戶常常需要把網頁、文檔、圖片或數據複製、拖拽到 AI 窗口裏,再輸入完整提示詞。

這種使用方式會打斷工作節奏,新方案希望反過來,讓 AI 直接出現在用戶正在使用的工具裏,依據指針位置和語音命令理解上下文。
DeepMind 總結了 4 條核心原則:
第 1 條是「保持工作流」,即 AI 能力應覆蓋各類應用場景,例如指向 PDF 後要求生成要點摘要並粘貼進郵件,懸停統計表格後要求生成餅圖,選中菜譜後要求把全部配料翻倍。
第 2 條是「邊指邊說」,通過捕捉指針周圍的視覺與語義信息,讓系統知道用戶究竟想處理哪個詞、哪段文字、哪塊圖片或哪段代碼。
第 3 條強調「這個」「那個」的自然表達方式。人與人交流時,本就依賴手勢和共享語境,不必每次都說完整長句。若 AI 能同時理解上下文、指向動作和語音,用戶只需說「改一下這個」或「把那個移到這裏」,也能發出複雜請求。
第 4 條原則則是把像素轉化為可操作實體,比如地點、日期、物體等,從而讓一張潦草便籤變成交互式待辦清單,讓旅行視頻中的餐廳畫面直接對應預訂鏈接。