阿里通義開源WebSailor 檢索性能超DeepSeek R1、Grok-3等模型

智通財經
2025/07/07

智通財經APP獲悉,近日,阿里通義開源了網絡智能體WebSailor,該智能體具備強大的推理和檢索能力,在高難度智能體評測集BrowseComp上,WebSailor的成績超越了DeepSeek R1、Grok-3等模型和智能體,一舉登頂開源網絡智能體排行榜。目前WebSailor的構建方案及部分數據集已在Github開源。

為了讓WebSailor更好地掌握複雜網頁信息處理能力,通義團隊設計了一套創新性的訓練方法,包括三個關鍵模塊:一是「地獄級試煉場」SailorFog-QA,通過真實網頁構建圖譜,製造信息混淆,讓模型跨越多個頁面整合線索,挑戰人類認知極限;二是「重構推理邏輯」,摒棄冗長重複的推理鏈,讓模型學習簡潔、直擊重點的思考方式,提升思維靈活性;三是「強化學習DUPO算法」,通過動態篩選高質量訓練樣本,提高訓練效率2~3倍。

在權威評測平台 BrowseComp-en / BrowseComp-zh 中:WebSailor-72B 得分高居開源榜首;中文排行榜中,與豆包(Doubao-Search)不分上下;更在英文排行榜中 超過 Grok-3 等閉源模型。不僅如此,它在相對簡單任務(如SimpleQA)中也表現優異。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10