Vibe Coding 開賽，阿里靠新模型贏麻了？

市場資訊

昨天

　　炒股就看金麒麟分析師研報，權威，專業，及時，全面，助您挖掘潛力主題機會！

（來源：極客公園）

當代碼擁有靈魂，或許纔是一場靜默革命的開始。

作者｜張勇毅

編輯｜鄭玄

如果你是已經接觸過 Vibe Coding 類產品的用戶，或許已經熟悉這類產品作爲“副駕駛”的屬性：它們往往就如同一位盡職的副駕駛。在你長途奔襲時，它能幫你盯着儀表盤，甚至在你打盹的間隙，幫你扶穩方向盤，補全下一行代碼，或是直接幫你生成某個功能。

但過去很長時間中，這類產品更多還只能是“副駕”，它執行的是用戶給出的任務清單，是對指令的被動響應。它難以或者完全無法理解用戶爲何要選擇這條路，更不明白開發者想要傳達的、心中真正的目的地在何方。

但如果，AI 不再滿足於副駕的角色呢？如果它能讀懂你的導航意圖，能預判前方的路況，甚至能在你給出目的地後，獨立規劃並跑完全程呢？它才真正有了能成爲一位真正的“全棧工程師”的可能。

今天，我深度體驗了阿里剛開源的 Qwen3-Coder：阿里雲甚至官方直接在簡介中，表明這就是目前代碼能力達到開源模型 SOTA 的存在。

根據海外知名模型 API 聚合平臺 OpenRouter 數據顯示，阿里千問 API 調用量暴漲，過去幾天已突破 1000 億 Tokens，在 OpenRouter 趨勢榜上包攬全球前三，是當下最熱門的模型。

包括 Qwen3-Coder 在內，本週阿里已連續開源 3 款重磅模型，分別斬獲基礎模型、編程模型、推理模型等主流領域的三項全球開源冠軍；其中千問 3 推理模型在創意寫作、數學、多語言的概念領域的能力，已經完全可比肩 Gemini-2.5 pro、o4-mini 等頂尖閉源模型，並創下全球開源模型的最佳性能表現。

說實話，即使 Qwen3-Coder 已經被譽爲“全球最好的編程模型”，登頂全球最大AI開源社區 HuggingFace 模型總榜冠軍的寶座，在打開它之前，我內心只是抱着“又一個國產模型”的、略帶審慎的期待。

然而，在經過了一天的測試與深度對話之後，這個號稱達到目前 SOTA 水準的新模型，真的給我帶來了關於 Vibe Coding 不一樣的體驗。

能創造數字空間的編程模型

我的 Qwen3-Coder“初體驗”，是從一系列過去我已知很難或完全無法完成的測試開始的。

我決定先用一個經典的“AI 設計品味照妖鏡”來試探它。我輸入了一段幾乎可以說是任性的指令：

“給我創建一個極客公園作爲科技新聞媒體的官網首頁，要有現代感的導航欄、吸引眼球的配色、簡潔的公司介紹、清晰的內容欄，以及一個完整的頁腳。”

在我對 Grok、ChatGPT 乃至 Gemini 類似產品的體驗中，類似的請求往往會收穫一個停留在上世紀 90 年代審美的災難現場：佈局混亂、配色辣眼，彷彿是對現代設計美學的一場公開處刑。

說實話，在正式的結果返回之前，我幾乎已經做好了心理準備，去迎接一個需要我從頭開始重構的、佈滿

標籤的混亂骨架。

然而，當代碼生成完畢，並在預覽中渲染出頁面的那一刻，呈現在我眼前的，是一個設計語言高度統一、採用響應式佈局、甚至還有界面動畫效果的完整頁面。

Qwen3-Coder 生成的極客公園網站首頁｜圖片來源：極客公園

如果說第一次的驚豔還停留在視覺層面，那麼接下來的測試，則開始觸及它更深層次的“靈魂”。

我向它提出了一個更抽象的挑戰：

“創建一個基於物理引擎的音樂生成器，使用 Matter.js，讓不同形狀的物體在畫布中自由下落，當它們相互碰撞時，能根據形狀發出不同音階的音符，並且，我需要一個‘重力控制器’來實時改變它們的下落軌跡。”

這個任務的難點，在於它要求 AI 不僅要理解代碼，更要理解代碼背後的世界。

代碼是理性的，但物理的律動和音樂的和諧，卻帶有一絲感性的溫度。Qwen3-Coder 的表現再次超出了我的預期。它實現了所有功能——你能看到小球、方塊在畫布中落下，每一次碰撞都奏出和絃。

當你拖動重力控制器，所有物體的運動軌跡隨之改變，原本舒緩的旋律瞬間變得急促，在你的屏幕上演奏着無序的樂章。它不僅完成了功能，甚至帶來了意想不到的藝術美感。

爲了進一步探尋它的邊界，我又拋出了一個生成遊戲的命題，讓它生成一個完全由鍵盤控制的 3D 射擊遊戲。同時有着多個可交互對象，甚至有一個簡單的“通關劇情”以及“彩蛋”，如果你能發現我留在代碼中的彩蛋信息，即可迅速通關。

從生成的結果上來看，Qwen3-Coder 返回的結果同時包括了對目標重力加速度的計算，以及碰撞檢測算法，乃至最讓我驚喜的部分——生成一個 3D 箱庭世界、同時對向量投影、距離檢測的檢測算法，都在這個小小的遊戲中得到準確的實現。

在物理模擬能力這塊，當然也少不了經典的小球彈跳遊戲，Qwen3-Coder 還是能夠輕鬆復現。

除了這些實際案例的結果，在測試中還有一個維度的體驗，不得不單獨拿出來談談，那就是它的生成速度餘長任務上下文記憶能力。

在我的實際測試中，超過十個不同的開發用例，幾乎都在 1-3 分鐘內得以解決。

900 餘行的代碼僅需要三分鐘的時間即可生成，這大大加快的代碼的迭代速度｜圖片來源：極客公園

這種返回效率，帶來的是一種相比此前代碼生成模型更流暢的創作心流，開發者得以將想法快速轉化爲現實，我可以迅速根據生成的結果、快速微調迭代代碼版本，而不用在漫長的等待中中斷思緒。

如今，行業裏每個人都在討論“Vibe Coding”（氛圍編程）。Vibe 固然是人機交互的未來所向，它關乎直覺與靈感。但我們或許也應該意識到，支撐起所有暢快“Vibe”的，終究是那不打折扣的，堅實可靠的“Coding”硬實力。

世界級的編程模型，是怎麼煉成的？

Qwen3-Coder 之所以能從一個“代碼補全器”，進化爲一個“自主開發者”，首先是它架構的選擇——混合專家（MoE）帶來的規模與效率。

傳統的巨大模型像一個知識淵博但全科的教授，雖然什麼都懂，但在處理特定專業問題時，仍需耗費大量精力。而 Qwen3-Coder“超大杯”版本，則像一個擁有 4800 億龐大知識儲備的“智囊團”，內部卻劃分了無數個高度專業的“領域專家”。

當你提出一個問題，系統並不會調用整個模型數據，而只會激活與該問題最相關的 350 億參數的“專家小組”進行響應。這種設計，讓它在擁有巨大知識容量和能力天花板的同時，又將單次推理的計算成本控制在了極爲合理的範圍內。這是一種在模型能力和推理效率之間取得的精妙平衡，也是它能處理複雜問題的關鍵基礎。

除此之外，阿里 Qwen 團隊認爲，編程任務“天然適合執行驅動的強化學習”，因爲代碼的正確性，可以通過實際運行結果這個最客觀的標準來直接驗證。基於此，他們構建了一個能夠並行運行兩萬個獨立環境的大規模強化學習基礎設施。

你可以把它想象成一個擁有兩萬名“數字實習生”的軟件公司。在這裏，模型可以海量地模擬真實的軟件工程流程：接收一個模糊的任務，自主地進行規劃和方案分解，然後調用外部工具（如代碼執行器、測試框架）去嘗試，並從環境的反饋（成功、失敗、或是具體的錯誤信息）中學習，最後根據反饋進行迭代和自我修正。

正是通過在這種大規模、高併發的真實編碼環境中進行的海量試錯和學習，Qwen3-Coder 才成功地學會了如何解決那些需要自主規劃和工具調用的“長視距”任務，它的代碼執行成功率和工具使用效率也因此得到了顯著提升。

最後也是到目前爲止，讓我覺得 Qwen3-Coder 體驗不同於以往代碼生成模型的關鍵所在，也是 Qwen3-Coder 自我糾錯能力與理解力的基石——處理大規模代碼庫的“倉庫級”上下文長度。

軟件工程的複雜性，往往源於對龐大代碼庫的理解。Qwen3-Coder 在這方面具備了物理層面的絕對優勢：它原生支持 256K tokens 的上下文窗口。這意味着什麼？這意味着模型可以在一次交互中，處理數百萬字符的代碼和文檔。

如果說 MoE 架構賦予了模型智慧的“潛力”，強化學習賦予了它解決問題的“技巧”，那麼超長上下文窗口則爲它提供了施展才華的“舞臺和物料”。沒有對整個系統全局的視野，再聰明的模型也只是一個“管中窺豹”的計算器。正是憑藉這一能力，Qwen3-Coder 才真正將任務的性質從“生成一段有效的代碼片段”提升到了“對一個複雜的軟件系統執行一次有效的操作”。

這種處理“倉庫級”代碼的能力，是解決複雜系統級問題、進行大規模代碼重構和深入理解遺留系統的先決條件，也是許多上下文窗口較小的模型所望塵莫及的。

在衡量代碼模型解決真實世界軟件問題的權威榜單 SWE-Bench 上，Qwen3-Coder 的得分實現了對 OpenAI 最強閉源模型之一 GPT-4.1 的明確超越。這意味着，在處理那些複雜、真實的編程任務時，這個來自中國的開源模型，展現出了更強的效能。

而在 Agentic Coding 這個以智能體能力爲核心的賽道上，Qwen3-Coder更是可以和一直以來的標杆 Claude 4 平起平坐。

目前，如果想上手 Qwen3-Coder 的話，最直接的方式莫過於訪問 chat.qwen.ai。在頁面的右上角可以一鍵切換模型。

如果你想要追求目前極致的“意圖優先”代碼體驗，或者你已經是 Vibe Coding 老手，你還可以自己嘗試“超大杯”，以 API 的方式，在各種 CLI 中調用Qwen3-Coder-480B-A35B-Instruct。

這是一個 480B 參數激活 35B 參數的 MoE 模型，原生支持 256K token 的上下文，並可通過 YaRN 擴展到 1M token。只需前往阿里雲註冊賬戶，完成簡單的認證，便能創建屬於你的 API-Key 調用這個模型。

得益於其對 OpenAI API 格式的完美兼容，你可以將這個 API-Key 無縫集成到你所熟悉的各類 Chat 或 Coding 工具中，無論是 Cursor、Trae、CodeBuddy 還是 Cline。

並且它比 Claude 便宜。在阿里雲百鍊上，Qwen3-Coder API 每百萬 Tokens 最低輸入和輸出價格分別爲 4 元和 16 元，平均價格爲 Claude 4 的 1/3。同時，阿里雲百鍊還推出了低至 5 折的限時優惠， 128K-1M 長上下文價格享受五折優惠。

而對於那些將數據主權和隱私安全置於首位的用戶，Qwen3-Coder 則提供了最徹底的解決方案——本地化部署。

你可以直接從 Hugging Face 或國內的魔搭社區下載完整的模型文件。這意味着，你可以將這個目前最強大的編程開源工具，完全私有化運行在自己的服務器上。

本土選擇的世界意義

寫到這裏，關於 Qwen3-Coder 的結論已經呼之欲出：它的出現，不是爲了取代誰，而是爲了武裝誰。它將一個資深開發團隊的綜合能力，壓縮進一個任何人都可以調用的工具裏，然後交到你的手上。

過去很長一段時間，當我們討論起頂尖的編碼大模型時，國內開發者的選擇似乎總是捉襟見肘。這背後反映了一個關鍵事實：在自然語言處理領域，中文語料的積累能爲國產模型帶來“主場優勢”；但在編程領域，代碼是世界的通用語言。無論是 Python、Java 還是 JavaScript，其語法和邏輯在全球都是統一的。

這意味着，編碼能力的競爭是在一個完全公平的全球化賽場上進行的。在這條賽道上，不存在語言壁壘，只有赤裸裸的技術實力比拼。

Qwen3-Coder 在 SWE-Bench 等國際公認的基準上取得領先，其意義遠超於在某個中文榜單上登頂。它標誌着中國自研的 AI 模型，在技術硬實力上，已經具備了在全球最前沿、競爭最激烈的領域中一較高下的能力。

如果說開源是一種態度，那麼從目前 Qwen3-Coder 展現出的能力上，似乎可以相信通義千問的決心與魄力。

價格方面，阿里不僅直接選擇了開源免費，其 API 的調用成本也遠低於海外的同級模型。

更重要的是，這是一款來自中國的開源模型——僅這一點，對中國用戶來講就意味着能隨時、穩定地調用，擺脫了對網絡環境、供應限制與訪問速度的擔憂。

它或許並非是唯一的選項，但很高興看到，在編碼大模型這條賽道上，國內的開發者們終於迎來了那個可靠、親切，且足夠好用的本土選手。

*頭圖來源：Qwen3 Coder

本文爲極客公園原創文章，轉載請聯繫極客君微信 geekparkGO

極客一問

你如何看待 Qwen3 Coder ？

海量資訊、精準解讀，盡在新浪財經APP

免責聲明：投資有風險，本文並非投資建議，以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請，作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考，不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證，投資者應自行研究並在投資前尋求專業建議。

老虎證券

Vibe Coding 開賽，阿里靠新模型贏麻了？

熱議股票