通義全尺寸GUI智能體基座模型MAI-UI開源:原生具備用戶交互能力

鳳凰網科技
2025/12/29

鳳凰網科技訊 12月29日,通義實驗室多模態交互團隊近日宣佈開源其通用GUI智能體基座模型MAI-UI。該模型旨在通過理解螢幕界面並執行操作,完成跨應用、多步驟的複雜任務,例如查詢車票、在通訊羣組同步信息、調整會議安排等。

據介紹,MAI-UI具備在指令不明確時主動向用戶提問澄清的能力,並支持通過調用結構化工具(如地圖搜索、路線規劃API)來替代繁瑣的界面點擊操作,以提高任務執行的成功率與效率。該模型家族包含2B、8B等不同參數規模的版本,其中2B與8B模型已開源。

根據團隊公布的評測數據,MAI-UI在ScreenSpot-Pro、AndroidWorld等多個GUI理解與任務執行基準測試中取得了當前領先的成績。該模型適用於手機、電腦等不同操作系統的界面交互場景。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10