智通財經APP獲悉,近日,阿里通義開源了網絡智能體WebSailor,該智能體具備強大的推理和檢索能力,在高難度智能體評測集BrowseComp上,WebSailor的成績超越了DeepSeek R1、Grok-3等模型和智能體,一舉登頂開源網絡智能體排行榜。目前WebSailor的構建方案及部分數據集已在Github開源。

為了讓WebSailor更好地掌握複雜網頁信息處理能力,通義團隊設計了一套創新性的訓練方法,包括三個關鍵模塊:一是「地獄級試煉場」SailorFog-QA,通過真實網頁構建圖譜,製造信息混淆,讓模型跨越多個頁面整合線索,挑戰人類認知極限;二是「重構推理邏輯」,摒棄冗長重複的推理鏈,讓模型學習簡潔、直擊重點的思考方式,提升思維靈活性;三是「強化學習DUPO算法」,通過動態篩選高質量訓練樣本,提高訓練效率2~3倍。
在權威評測平台 BrowseComp-en / BrowseComp-zh 中:WebSailor-72B 得分高居開源榜首;中文排行榜中,與豆包(Doubao-Search)不分上下;更在英文排行榜中 超過 Grok-3 等閉源模型。不僅如此,它在相對簡單任務(如SimpleQA)中也表現優異。


