IT之家 11 月 8 日消息,科技媒體 Ars Technica 今天(11 月 8 日)發布博文,報道稱最近幾個月,部分 ChatGPT 用戶的個人敏感對話內容被發現持續泄露至谷歌搜索控制台(GSC)。
IT之家注:谷歌搜索控制台全稱為 Google Search Console,是谷歌提供給網站所有者和管理員的一款免費工具。站長可以用它來查看自己網站在谷歌搜索中的表現,比如用戶通過哪些關鍵詞找到了自己的網站、網站的點擊率等,從而優化網站內容。
網站管理員通常使用此工具分析關鍵詞流量,但從今年 9 月開始,他們發現了一些超過 300 個字符的異常「查詢」,內容實為用戶尋求情感或商業建議的完整聊天記錄。這些用戶很可能認為他們的對話是私密的,卻在不知不覺中被暴露。
分析諮詢公司 Quantable 的所有者 Jason Packer 聯合網絡優化顧問 Slobodan Manić 展開調查,他們認為這可能是「第一個確鑿證據,證明 OpenAI 直接使用實際的用戶提示來抓取谷歌搜索」。

調查發現,一個存在故障的 ChatGPT 頁面會將自身 URL(https://openai.com/index/chatgpt/)附加到用戶提示的前端,並強制執行谷歌搜索。由於只有通過直接抓取而非 API 調用的方式,查詢內容纔會出現在 GSC 中,因此專家認定,這暴露了 OpenAI 的數據抓取行為。

針對這一問題,OpenAI 的發言人向媒體確認公司已知曉並「解決了一個技術故障」,該故障「暫時影響了少量搜索查詢的路由方式」。然而,OpenAI 拒絕證實專家關於其抓取谷歌數據的理論,也未提供受影響用戶的具體數量,迴避了外界最核心的關切。

與此同時,谷歌方面則拒絕對此事發表評論。Packer 指出,OpenAI 的回應並未澄清他們是否停止了抓取行為,這讓問題的徹底解決留下了疑問。
此次泄露事件與以往有本質不同。在之前的泄露事件中,用戶至少需要主動點擊「分享」按鈕。而這一次,用戶完全是在被動狀態下被泄露隱私,且沒有合理的方式來阻止。
更令人擔憂的是,這些已經出現在 GSC 中的聊天記錄似乎無法被移除。目前,仍不清楚此次泄露的波及範圍有多廣,以及 OpenAI 的修復措施是否真正杜絕了未來的風險。