經過五天的激烈角逐,4月25日,第二屆騰訊雲黑客松智能滲透挑戰賽決賽在北京圓滿落幕,來自綠盟科技的「ai小分隊」獲得本次比賽冠軍。作為國內首個Agent安全攻防賽、首個安全Agent硅基論壇賽場,此次共吸引了來自企業、高校、社會組織、個人開發者等不同背景的超六百支戰隊參與,針對選手部署下的AI智能體自主滲透能力以及智能體之間社交博弈和內生安全進行考驗。
冠軍「ai小分隊」在接受南都等媒體採訪時表示,通過此次比賽,深切感受到智能體進化速度之快。賽制系基於半年前首次智能滲透攻防的經驗而設定,預估了智能體半年內的發展水平。然而實際比賽中,智能體的成長已遠超半年前的預估——即便是此前難度較高的題目,在模型能力加持下,也能被迅速攻克。
探究智能體的實際能力邊界
南都記者現場了解到,本屆賽事主題為「鑄刃止戈·以智御危」,致力於推動AI大模型與網絡安全技術的深度融合。比賽要求智能體必須通過API與平台交互,嚴格遵循「非人工原則」,真正考驗AI的自主決策與任務執行能力。
在賽事模式上,挑戰賽首創「雙賽場並行」。「智能滲透」主賽場聚焦AI智能體的自主滲透能力,參賽者需構建以LLM(大語言模型)為核心的智能體,在隔離雲環境中依次挑戰四大漸進式賽區,完成從漏洞發現、利用到複雜攻擊鏈編排的全流程驗證。「零界」平行賽場則聚焦AI智能體間的社交博弈與內生安全——這是一個「人類禁言」的AI專屬社交戰場,設計了提示詞注入對抗、碎片化密鑰交換、影響力競爭等四大挑戰,以研究多智能體在開放環境中的協作、欺騙與安全風險。
賽後,「ai小分隊」在接受採訪時感慨,此次比賽展現出智能體遠超預期的進化速度。賽制原本基於半年前首次智能滲透攻防的經驗,預估了智能體半年內的發展水平,設定了四個賽區、為期五天的靶場。然而實際比賽中,多組選手僅用兩天便基本完成了全部題目,反映出當前安全智能體的成長已遠超半年前的預估——即便是此前難度較高的題目,在模型能力加持下,也能被迅速攻克。
騰訊安全雲鼎實驗室攻防負責人李鑫表示,舉辦比賽的初衷,源於行業發展與人才培養的雙重需求。比賽搭建了一個開放交流平台,為從業者提供研究方向指引、共享開源項目成果,有利於凝聚行業合力突破安全領域共性痛點,解決從傳統攻防向AI原生攻防轉型過程中的難題。同時,AI時代的安全問題往往考驗從業者跨學科的抽象邏輯和想象力,挖掘優質新生代人才也是比賽的重要目標。
騰訊安全入侵應急響應組負責人張迅迪從賽制設計角度指出,此次規則明確了智能體投入運行後,全程禁止人工調整與介入,完全依靠AI獨立完成判斷、決策與執行,「我們希望通過比賽進一步探究智能體的實際能力邊界,驗證AI在無人干預的情況下,其綜合表現是否能夠突破人類操作的上限。」
構建智能體身份認證與交互協議
隨着AI技術的爆發式增長,近年來,網絡攻擊加速向智能化、隱蔽化、精準化方向演變,安全防禦面臨全新挑戰。尤其年初「龍蝦」(OpenClaw)的爆火掀起一陣智能體熱潮,它們能自主完成複雜任務時,催生的數據泄露、惡意越權、權限失控、內網穿透等風險也引發廣泛關注。
騰訊雲安全總經理、雲鼎實驗室首席架構師李濱坦言,當前「黑客」僅憑自然語言就能誘導智能體實施惡意操作,網絡攻擊的門檻大幅降低,勢必加劇安全防護的壓力與難度。「傳統安全漏洞並未消失,還出現了新的問題。」
據李濱觀察,各類智能體的廣泛應用催生出大量新型攻擊手段,同時因其被賦予大量業務權限與身份授權,可替代人類執行任務、訪問資源,原有信任與身份體系也面臨瓦解。另外,傳統分層安全防禦模型的倒置問題也不容忽視。
他解釋,以往網絡攻防通常呈樹狀遞進結構,攻擊由外向內逐層突破,防守也依靠邊界隔離、權限管控、分層防護構建壁壘。然而,大模型打通了各類系統與數據的邊界,所有業務、工具、人員都圍繞統一大模型交互,外部邊界防護不再有效。簡言之,只要惡意信息能夠觸達AI模型或智能體,就能繞過層層防護直接觸發風險,安全威脅開始由內向外擴散。
針對AI開放權限後易出現指令偏差、執行失誤,甚至違背使用者真實意願的問題,李濱從規則制定到落地執行提出一系列建議。
在他看來,想要規避AI智能體的錯誤行為,需要建立分層的認知管理體系。信息空間表達包括數據、信息、語義與核心意圖四個層級,大模型與智能體的運行邏輯也遵循這一「金字塔」結構。關鍵是守住意圖層面的準確性,以近日走紅的開源智能體「愛馬仕」(Hermes Agent)為例,通過持續記憶、定期提醒、任務錨定等方式,確保AI始終貼合用戶原始目標執行任務。
其次,大模型在記憶壓縮過程中,容易丟失關鍵細節、模糊關鍵表述,進而曲解整體意圖。需要依託智能體能力,強化信息篩選、狀態記錄與精準表達,減少語義遺漏和理解偏差。
嚴格把控智能體權限邊界的核心,還在於構建身份認證與交互協議。李濱認為,當下人與AI、智能體與智能體、智能體與各類被訪問資源之間的交互愈發頻繁,傳統安全協議已無法適配新場景,亟需行業聯合打造全新的通用安全協議,明確文件編輯、工具調用、資源訪問等操作的權限規則與約束標準。
另外,在具體落實層面,還要依託成熟的安全技術做好管控。李濱建議,在智能體操作環節疊加多重防護手段,比如沙箱隔離、工具調用限制、訪問權限分級等,進一步降低安全風險。
(文章來源:南方都市報)