作者 | 李水青
編輯 | 雲鵬
智東西9月6日報道,昨夜,阿里上線Qwen3系列最強模型Qwen3-Max的Preview版本,這也是阿里迄今爲止最大的模型,參數量超1萬億。該模型目前已登陸阿里百鍊平臺,且在通義千問應用及Qwen Chat上免費可用。
據百鍊平臺介紹,Qwen3-Max-Preview相較2.5系列整體通用能力有大幅度提升,中英文通用文本理解能力、複雜指令遵循能力、主觀開放任務能力、多語言能力、工具調用能力均顯著增強;模型知識幻覺更少。
就在昨日,Qwen官方X賬號預告了即將推出Qwen3家族中最強大、最聰明的一員。今天,這一模型正式上線,其測評結果也隨之公佈。
據悉,Qwen3-Max-Preview在通用知識(SuperGPQA)、數學推理(AIME25)、編程(LiveCodeBench v6)、人類偏好對齊(Arena-Hard v2)以及綜合性能力評估(LiveBench)評測中,超越了Claude-Opus 4(Non-Thinking),以及Kimi-K2、DeepSeek-V3.1和阿里此前的開源最佳Qwen3-235B-A22B-Instruct-2507。
在AI模型聚合平臺OpenRoute上,Qwen3-Max的介紹提及:其在推理、指令執行、多語言支持和長尾知識覆蓋方面均有顯著改進;同時在數學、編程、邏輯和科學任務中提供了更高的準確率。該模型支持超過100種語言,具有更強大的翻譯和常識推理能力,並針對檢索增強生成 (RAG)和工具調用進行了優化,但並未包含專門的“思考”模式。
智東西第一時間在通義千問網頁端上對Qwen3-Max-Preview進行了體驗,發現模型在文本理解以及數學、編程能力上效果出色,且響應速度很快。
首先讓Qwen3-Max-Preview生成一個小球碰撞模擬器,我們輸入提示詞:
“一個圓裏面有兩個小球,一個黑色,一個白色,白色的球隨即位置自由下落,碰到邊界會反彈,同時再生成一個隨機位置的白色小球,黑色小球碰到邊界會反彈,碰到白色的球會變大一點,請模擬一下。”
只見Qwen3-Max-Preview很快輸出了這個程序,模擬出了兩類球的運動過程,最終黑色球膨脹至把白球吞噬。
當我們把難度提升,讓Qwen3-Max-Preview進行一個力量與速度種羣模擬,並不斷優化這個模擬器,發現Qwen3-Max-Preview能夠實現快速而準確的模擬,能在幾秒鐘之內完成一個成熟程序員可能需要大半天才能完成的工作。
我們輸入提示詞:“有兩個種羣,種羣a注重力量的發展,種羣b注重速度的發展,請模擬一下兩個種羣之間的相互作用並給出說明。”
如下圖所示,即便我給出的提示詞非常模糊,Qwen3-Max-Preview依然理解到我的意思,並給出了較準確的模擬。
在上述模擬中,我發現速度型種羣被幹掉的太快了,於是進一步希望它們能夠具備“逃跑”能力。我輸入提示詞:“注重速度的種羣被幹掉的太快了,他們每個個體都應該具備一定的躲避危險的能力。”
而後,Qwen3-Max-Preview輸出了以下“力量與速度種羣模擬(增強版)”,準確模擬出了具有躲避危險能力的小球,出現“誰也幹不掉誰”的狀況。
只會逃跑不會反擊,早晚還是被幹掉。於是我要求速度型種羣具有協作進攻能力,輸入提示詞:
“當速度型種羣團結起來的時候,可以可以幹掉單個的力量型個體,請加上這個能力再模擬一下。”
Qwen3-Max-Preview依然能夠很好的實現,輸出了“力量與速度種羣模擬(協作版)”,模擬出小綠球有了協作能力後能抵禦紅球的能力,但雙方態勢依然很僵持。
隨着模擬的進行,兩邊種羣越來越少,於是我們進一步要求Qwen3-Max-Preview給它們繁衍的能力,輸入提示詞:
“當它們雙方幹掉對方個體後,可以積累養分,繁衍自己,繼續模擬。”
於是,Qwen3-Max-Preview輸出了“力量與速度種羣模擬(資源與繁衍版)”,從模擬可以看到,兩類球都自行開始裂變,在這種情況下,紅球已經幹不過綠球了。
於是,我又輸入:
“發現力量型種羣太弱了,它們根本抓不到對面,請給它們也提供團隊協作的能力,可以圍捕速度型選手。”
Qwen3-Max-Preview輸出了“力量與速度種羣模擬(雙向協作版)”,小綠球和小紅球分別形成抱團趨勢,從而形成了兩邊“羣毆圍攻”的態勢。
通過這個有趣的小實驗我們發現,Qwen3-Max-Preview在提示詞表意很模糊的情況下,也能夠順利理解到用戶意圖。
尤其是“躲避危險”、“團結”、“協作”、“繁衍”等表述是比較抽象的,且對應的實際含義很複雜,實現起來涉及調節的參數很多,但Qwen3-Max-Preview都在幾秒鐘之內準確理解語義及背後的邏輯,並完成模擬實驗的編程,體現其在複雜推理、指令執行、數學、編程等能力方面的出色能力。
由百鍊平臺可知,在定價方面,Qwen3-Max-Preview支持256k上下文,根據輸入token數採取階梯計費:
輸入0-32k token價格:0.006元/千token輸入,0.024元/千token輸出。
輸入32k-128k token價格:0.01元/千token輸入,0.04元/千輸出。
輸入128k-252k token價格:0.015元/千token輸入,0.06元/token輸出。
對比Qwen-Max-0919的0.02元/千token輸入、0.06元/千token輸出的價格,Qwen3-Max-Preview的定價更有層次,性能更高但價格更加實惠。
體驗地址:
https://chat.qwen.ai
阿里雲百鍊API服務:
https://bailian.console.aliyun.com/?tab=model#/model-market
結語:超大Qwen3模型,證明規模化擴展效果
模型層的突破正成爲阿里AI轉型的第一張王牌。在內部測試和早期用戶測評中,Qwen3-Max-Preview表現出更廣的知識面,更優秀的對話能力,在Agent任務與指令遵循等方面擁有更強勁的性能。
通義千問大模型開源閉源兩手抓,已代表了中國大模型的技術新高度。Qwen3-Max-Preview刷新了阿里大模型參數新紀錄,其試圖用更加強悍的性能,證明規模化擴展的效果——更大的模型擁有更強的性能。