記者5月6日獲悉,國際權威大模型測評榜LiveBench公布了最新一期排名,阿里巴巴開源的新一代通義千問模型Qwen3(簡稱「千問3」)斬獲全球開源模型冠軍,並在指令遵循(Instruction Following)這一關鍵能力上超越o3 High、o4-Mini High、Gemini 2.5 pro等頂級閉源模型,位列全球第一。
據了解,LiveBench排行榜由圖靈獎得主、Meta首席AI科學家楊立昆(Yann LeCun)聯合紐約大學等機構推出,從數學、推理、編程、語言理解等多個複雜維度全面評估大模型。因其採用動態更新的題庫,被譽為「全球首個無法作弊的模型基準測試」。(上證報)