炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛力主題機會!
日前,世界數字科學院(WDTA)在聯合國日內瓦總部正式發布AI STR系列新標準《AI智能體運行安全測試標準》。
該標準由螞蟻集團、清華大學、中國電信牽頭,聯合普華永道、新加坡南洋理工大學、美國聖路易斯華盛頓大學等二十餘家國內外機構、企業及高校共同編制,為全球首個單智能體運行安全測試標準。

據介紹,該標準針對智能體跨越「語言牆」所帶來的「行為」風險,首次將輸入輸出、大模型、RAG、記憶和工具五個關鍵鏈路與運行環境對應起來,構建了全鏈路風險分析框架;同時,細分了智能體風險類型,完善並創新提出了模型檢測、網絡通信分析和工具模糊測試等測試方法,彌補了智能體安全測試技術標準的空白。
標準在AI for Good全球峯會期間由聯合國社會發展研究所(UNRISD)與世界數字科學院(WDTA)聯合主辦的「數字技術與人工智能社會影響全球諮詢會」上發布。
WDTA執行理事長李雨航強調,「AI STR系列標準試圖建立清晰、可執行的安全標準和測評、認證體系,將倫理與責任嵌入AI的全生命周期之中,從而確保技術發展服務於人類的長期利益。」
峯會上,螞蟻集團大模型數據安全總監楊小芳表示,當前AI技術應用加速落地,但單智能體的安全風險缺乏統一的全鏈路安全測試標準,導致潛在的等問題難以被量化和規避,單智能體標準的制定是AI治理的「最小可行單元」,而多智能體治理是未來「摩天大樓」的核心結構,下一步行業應從單點逐步向多智能體治理生態共建突破。
與其他國際標準不同,AI STR不僅關注風險識別和風險分級,更提供全流程管理方案,即從數據治理到模型落地,配套具體測試工具和認證流程,助力企業提升AI應用的安全性與可信度。
該標準不僅提供了一套可行可靠的智能體安全基準,也為全球AI智能體生態的安全、可信和可持續發展增加了有益的探索。目前,部分標準的測評與認證已在金融、醫療等領域落地應用。
此前,WDTA已發布3項AI STR標準,包括「生成式人工智能應用安全測試標準」「大語言模型安全測試方法」和「大模型供應鏈安全要求」,由OpenAI、螞蟻集團、科大訊飛、谷歌、微軟、英偉達、百度、騰訊等數十家單位的多名專家學者共同參與。
上游新聞記者 楊昕華
(轉自:網易科技)