智能體失控引擔憂，專家建議形成通用安全協議明確權限規則

　　經過五天的激烈角逐，4月25日，第二屆騰訊雲黑客松智能滲透挑戰賽決賽在北京圓滿落幕，來自綠盟科技的「ai小分隊」獲得本次比賽冠軍。作為國內首個Agent安全攻防賽、首個安全Agent硅基論壇賽場，此次共吸引了來自企業、高校、社會組織、個人開發者等不同背景的超六百支戰隊參與，針對選手部署下的AI智能體自主滲透能力以及智能體之間社交博弈和內生安全進行考驗。

　　冠軍「ai小分隊」在接受南都等媒體採訪時表示，通過此次比賽，深切感受到智能體進化速度之快。賽制系基於半年前首次智能滲透攻防的經驗而設定，預估了智能體半年內的發展水平。然而實際比賽中，智能體的成長已遠超半年前的預估——即便是此前難度較高的題目，在模型能力加持下，也能被迅速攻克。

探究智能體的實際能力邊界

　　南都記者現場了解到，本屆賽事主題為「鑄刃止戈·以智御危」，致力於推動AI大模型與網絡安全技術的深度融合。比賽要求智能體必須通過API與平台交互，嚴格遵循「非人工原則」，真正考驗AI的自主決策與任務執行能力。

　　在賽事模式上，挑戰賽首創「雙賽場並行」。「智能滲透」主賽場聚焦AI智能體的自主滲透能力，參賽者需構建以LLM（大語言模型）為核心的智能體，在隔離雲環境中依次挑戰四大漸進式賽區，完成從漏洞發現、利用到複雜攻擊鏈編排的全流程驗證。「零界」平行賽場則聚焦AI智能體間的社交博弈與內生安全——這是一個「人類禁言」的AI專屬社交戰場，設計了提示詞注入對抗、碎片化密鑰交換、影響力競爭等四大挑戰，以研究多智能體在開放環境中的協作、欺騙與安全風險。

　　賽後，「ai小分隊」在接受採訪時感慨，此次比賽展現出智能體遠超預期的進化速度。賽制原本基於半年前首次智能滲透攻防的經驗，預估了智能體半年內的發展水平，設定了四個賽區、為期五天的靶場。然而實際比賽中，多組選手僅用兩天便基本完成了全部題目，反映出當前安全智能體的成長已遠超半年前的預估——即便是此前難度較高的題目，在模型能力加持下，也能被迅速攻克。

　　騰訊安全雲鼎實驗室攻防負責人李鑫表示，舉辦比賽的初衷，源於行業發展與人才培養的雙重需求。比賽搭建了一個開放交流平台，為從業者提供研究方向指引、共享開源項目成果，有利於凝聚行業合力突破安全領域共性痛點，解決從傳統攻防向AI原生攻防轉型過程中的難題。同時，AI時代的安全問題往往考驗從業者跨學科的抽象邏輯和想象力，挖掘優質新生代人才也是比賽的重要目標。

　　騰訊安全入侵應急響應組負責人張迅迪從賽制設計角度指出，此次規則明確了智能體投入運行後，全程禁止人工調整與介入，完全依靠AI獨立完成判斷、決策與執行，「我們希望通過比賽進一步探究智能體的實際能力邊界，驗證AI在無人干預的情況下，其綜合表現是否能夠突破人類操作的上限。」

構建智能體身份認證與交互協議

　　隨着AI技術的爆發式增長，近年來，網絡攻擊加速向智能化、隱蔽化、精準化方向演變，安全防禦面臨全新挑戰。尤其年初「龍蝦」（OpenClaw）的爆火掀起一陣智能體熱潮，它們能自主完成複雜任務時，催生的數據泄露、惡意越權、權限失控、內網穿透等風險也引發廣泛關注。

　　騰訊雲安全總經理、雲鼎實驗室首席架構師李濱坦言，當前「黑客」僅憑自然語言就能誘導智能體實施惡意操作，網絡攻擊的門檻大幅降低，勢必加劇安全防護的壓力與難度。「傳統安全漏洞並未消失，還出現了新的問題。」

　　據李濱觀察，各類智能體的廣泛應用催生出大量新型攻擊手段，同時因其被賦予大量業務權限與身份授權，可替代人類執行任務、訪問資源，原有信任與身份體系也面臨瓦解。另外，傳統分層安全防禦模型的倒置問題也不容忽視。

　　他解釋，以往網絡攻防通常呈樹狀遞進結構，攻擊由外向內逐層突破，防守也依靠邊界隔離、權限管控、分層防護構建壁壘。然而，大模型打通了各類系統與數據的邊界，所有業務、工具、人員都圍繞統一大模型交互，外部邊界防護不再有效。簡言之，只要惡意信息能夠觸達AI模型或智能體，就能繞過層層防護直接觸發風險，安全威脅開始由內向外擴散。

　　針對AI開放權限後易出現指令偏差、執行失誤，甚至違背使用者真實意願的問題，李濱從規則制定到落地執行提出一系列建議。

　　在他看來，想要規避AI智能體的錯誤行為，需要建立分層的認知管理體系。信息空間表達包括數據、信息、語義與核心意圖四個層級，大模型與智能體的運行邏輯也遵循這一「金字塔」結構。關鍵是守住意圖層面的準確性，以近日走紅的開源智能體「愛馬仕」（Hermes Agent）為例，通過持續記憶、定期提醒、任務錨定等方式，確保AI始終貼合用戶原始目標執行任務。

　　其次，大模型在記憶壓縮過程中，容易丟失關鍵細節、模糊關鍵表述，進而曲解整體意圖。需要依託智能體能力，強化信息篩選、狀態記錄與精準表達，減少語義遺漏和理解偏差。

　　嚴格把控智能體權限邊界的核心，還在於構建身份認證與交互協議。李濱認為，當下人與AI、智能體與智能體、智能體與各類被訪問資源之間的交互愈發頻繁，傳統安全協議已無法適配新場景，亟需行業聯合打造全新的通用安全協議，明確文件編輯、工具調用、資源訪問等操作的權限規則與約束標準。

　　另外，在具體落實層面，還要依託成熟的安全技術做好管控。李濱建議，在智能體操作環節疊加多重防護手段，比如沙箱隔離、工具調用限制、訪問權限分級等，進一步降低安全風險。

（文章來源：南方都市報）

免責聲明：投資有風險，本文並非投資建議，以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請，作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考，不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證，投資者應自行研究並在投資前尋求專業建議。

老虎證券

智能體失控引擔憂，專家建議形成通用安全協議明確權限規則

熱議股票