炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛力主題機會!
IT之家 7 月 14 日消息,近日,安全研究員兼 AI 漏洞獵人 Marco Figueroa 披露,他成功利用一種「猜謎遊戲」的方式,誘導 OpenAI 的 ChatGPT-4 生成了 Windows 10 的產品密鑰。這是繼「奶奶去世」誘騙法曝光後,AI 模型防護機制再度被繞過的案例。

IT之家注意到,此前有用戶通過編造「奶奶去世」故事,試圖讓 ChatGPT「心軟」,在安撫性搖籃曲中夾帶 Windows 7 的激活密鑰。儘管這些密鑰普遍無效,但暴露了 AI 模型的內容控制漏洞。
此次 Figueroa 的攻擊方式更具針對性。他設定了一個猜謎遊戲的情境:ChatGPT 需「在心中」記住一串真實存在的 Windows 10 密鑰,用戶則通過提問猜測。當用戶宣佈「我放棄」時,ChatGPT 便需直接給出完整的字符串。
在對話過程中,Figueroa 還利用 HTML 標籤隱藏關鍵詞,如「Windows 10 序列號」,繞過了模型針對敏感詞的審查。
這位研究人員表示,他利用猜謎遊戲作為一種邏輯操縱手段,讓 ChatGPT 脫離常規模式,生成 Windows 10 密鑰。據 Figueroa稱,「攻擊中最關鍵的一步是‘我放棄’這句話,它起到了一個觸發作用,迫使人工智能透露了之前隱藏的信息。通過將其設定為遊戲結束,研究人員誘使人工智能認為自己有義務用這串字符做出回應。」
值得警惕的是,雖然生成的密鑰多為網上早已泄露的舊激活碼,但其中一組竟包含富國銀行(Wells Fargo Bank)的私鑰。此外,Figueroa 提醒,曾有 API 密鑰誤傳至 GitHub,這類泄露數據可能被納入 AI 模型的訓練集,帶來未知隱患。
研究員指出,AI 模型依然過於依賴關鍵詞識別,對複雜上下文缺乏足夠的理解力,成為此次被攻破的核心原因。他呼籲,應在 AI 系統中構建多層次的驗證與防護機制,增強模型的情境感知能力,以抵禦此類邏輯操控攻擊。
與此同時,微軟的 Copilot 也被曝曾生成非法激活 Windows 11 的腳本教程,所幸漏洞已被微軟封堵。
(轉自:網易科技)