阿里千問變局：天才與巨頭的分叉口

本文來自微信公衆號：光錐智能，作者：關注前沿科技的

3月4日凌晨，林俊暘在X上發布「me stepping down.bye my beloved qwen」，那時他是否會想到如此之大的輿論震動，我們不得而知。

但在前一天宣傳模型，後一天就宣告離開的情況下，千問大模型（下稱Qwen）裂開了一條縫隙，外部得以嗅到來自阿里內部變化的氣息。

一天後，阿里集團CEO吳泳銘簽發了林俊暘的離職令，並以前所未有的姿態組建了一個由集團最高權力核心構成的「三人小組」，這個三人小組包括吳泳銘、阿里雲CTO周靖人和現任餓了麼董事長兼CEO的範禹，共同接管Qwen資源調度的問題。

放在今天，Qwen在中國開源生態的貢獻上有目共睹，但帶頭做出Qwen2.5、Qwen3系列模型的兩個技術負責人周暢和林俊暘，先後離開了阿里。

在這場離職風暴的中心，隱藏着一個關於「實驗室理想」與「AI帝國」如何註定分離的命題：

阿里需要的，是一個能夠證明阿里AI實力的先進模型，為阿里拿下AI時代的新入口；一個能在MaaS戰場上，為阿里雲收割付費Token消耗的穩定引擎。而林俊暘追求的，是極致的開源精神和垂直整合的組織架構。

兩者的故事中，誰都沒錯，但林俊暘和阿里，已經逐漸來到了分道揚鑣的岔路口。

告別Qwen

周暢和林俊暘先後出走的背後

要理解這場離職風暴的深層邏輯，需要將時間撥回更久以前。

在林俊暘之前，阿里巴巴在大模型領域已經經歷了一次核心人才的變化。

第一次，以周暢為首的AI團隊跳槽，是阿里Qwen團隊技術骨幹出走的一個關鍵節點。

曾作為阿里P9級別員工的周暢，選擇加入了字節跳動。據悉，加入字節後，周暢不僅獲得字節4-2職級，相當於連跳兩級，且薪資高達千萬級別，比之前翻了好幾倍。

周暢的離職，不僅是因為薪資，一部分原因也在於對個人對技術路線的偏好。據晚點LatePost報道，彼時的周暢看好多模態方向，但放在2024年，也就是大廠集中押注大語言模型的情況下，周暢看中了字節視覺團隊拋來的橄欖枝。

人才的流失，顯然引起了阿里的警覺。作為接過周暢重任、擔任阿里Qwen模型團隊的技術負責人，從校招P6級別進入阿里，到幾年內多次升職，林俊暘成為了阿里最年輕的P10級別員工。

用馬雲的話說，離職無非兩種原因，一是錢沒有給到位，二是「心委屈了」。林俊暘的走，顯然屬於後一種。

3月4日凌晨，林俊暘在X上宣佈離職，到第二天阿里批准離職。兩天時間內，通過阿里員工發言和媒體報道，基本已經還原出林俊暘的離開，其中難免有和阿里組織的摩擦問題。

最影響到Qwen本身發展的，可能是對團隊內部資源不足的摩擦。

一個小切口是，林俊暘需要牽頭為Qwen碼來更多資源，難免對Qwen團隊內部是否為AI Infra額外投入、投入多少的想法不同。

林俊暘本人對Infra非常看重，這一點，他也在公開場合強調過。

「今天還有一個激動人心的事情，算法和Infra聯合優化的事情是真真實實存在的。」林俊暘在AGI-Next峯會上說，「除了像DeepSeek提到的提升訓練效率、節省資源成本外，我們要完成難度高的任務，都需要Infra的相關支持。」林俊暘說。

雖然阿里有額外的機器學習平台PAI負責提供這部分的支撐，但在林俊暘看來，還需要進一步加碼，比如在團隊中招聘更多相應人才。在林俊暘的社媒平台中，也公開放出過招聘Infra相關人才的信息。

林俊暘在社交媒體上招RL Infra崗位人員

對Infra的看重，不只是林俊暘對阿里的判斷。落在今年對AI失意的騰訊身上，Infra也成了「天才少年」、OpenAI前研究員姚順雨加盟後的重點之一。

在光錐智能此前的文章《騰訊重構AI的1000天》中，也曾提及，在騰訊年會上，內部表示，此前模型訓練的一些問題原因可能在於基礎設施Infra的不足。在姚順雨進入騰訊後，公司單獨成立了AI Infra部門和AI Data部門，區別於之前的部門架構，TEG中和AI訓推相關的工作不再和其他業務合併，而是獨立為AI服務。

但在後期，林俊暘希望自建Infra的實現並不順遂。在晚點播客中，提及林俊暘為了達成相關目標，發生了越過周靖人向阿里集團CEO兼阿里雲CEO吳泳銘尋求HeadCount（正職名額）的情況。所幸最終，林俊暘如願以償。

至於在其它資源上的不足，在3月4日阿里內部召開的會議中，阿里也承認了這一點。據智能湧現報道，關於招聘問題、內部算力有限問題，周靖人表示，團隊處於「資源緊張狀態」，內外差異有很多歷史原因，未來會進一步規劃。

發力頂尖模型

阿里對內動刀

在「為什麼做」的問題上，阿里與林俊暘之間同樣存在深刻的裂痕。

作為純技術人才，林俊暘在Qwen開源模型名氣的打響上，起到濃墨重彩的一筆。也是在AGI-Next峯會上，林俊暘曾經分享過團隊為什麼會考慮做小尺寸模型，起始是因為團隊中有人曾建議開源用於預訓練試驗的1.8B小尺寸模型，會對一些開發者起到幫助。

林俊暘

林俊暘對開源政策的激進，也在公開發言中有所體現。他曾表示，自己希望推進Qwen3-Max大模型的開源，但未能如願。

「全尺寸、多模態、重開源」的策略，幫助阿里在開源社區中建立了無可匹敵的生態優勢。以最新發布的Qwen3.5為例，除了最先開源的版本，阿里還後續發布了Qwen3.5系列的0.8B、2B、4B和9B四款小尺寸模型，在X上獲得了馬斯克的讚好。

但在阿里的視角中，從追求AGI的願景上，阿里需要的是一個能夠領先於「六小虎」和字節、騰訊的多模態大模型；於阿里雲需要靠MaaS擴張業務的情況下，集團希望有一個能打的大模型，像Kimi K2.5、字節豆包模型那樣，在API上收入進一步擴大。

在Qwen核心人員百餘人、資源有限的情況下，Qwen系列的旗艦模型在國內大模型混戰中，無法做到在所有系列中都拿到最好成績。

以最新發布的Qwen 3.5旗艦模型為例，作為一個參數397B的原生多模態大模型，講究「力大磚飛」的情況下，讓它和月之暗面萬億參數級別的Kimi-K2.5放在一起比分數，似乎有些尷尬。在Coding當前更看重模型質量階段，Qwen3.5雖然做到了性價比優勢，但它不是當前「掰腕子」的核心。換言之，Qwen3.5的發力和阿里內部的期許，走偏了。

回顧之前Qwen2.5、Qwen3系列大模型，阿里當前在模型生態上的成績有目共睹，甚至被稱為「源神」。但在大模型發展如此迅速的情況下，阿里也依然很着急。

出於對AI的焦慮，挖人、組織架構的調整，就變成了順理成章的思路，這一點在大廠上，基本是必選項。

在谷歌擔任L7級別、參與Gemini研發的周浩，是阿里從硅谷挖回來的人才。據悉，周浩將接手的是Qwen團隊的後訓練負責人一職，這也對應了前後訓練負責人鬱博文的離開。

人才是第一步，接下來，阿里將到對準內部，開始對組織架構動刀。據悉，這也是引爆林俊暘和阿里衝突的導火索之一。

多家媒體報道，通義實驗室近期計劃將Qwen團隊分拆，從涵蓋不同訓練流程和模態的「垂直整合」體系，變成預訓練、後訓練、文本、多模態等一個個分開的水平分工團隊。更進一步的是通義實驗室內部之間的合併，比如將Qwen負責圖像模態的部分併入負責圖像生成的通義萬相。語音模型部分併入通義百靈。

但在林俊暘之前所在的架構來說，他更堅信「垂直整合」的思路——將模型訓練的全流程，從數據處理、架構設計、預訓練、後訓練到推理部署，都控制在同一個團隊內部，形成高度協同的閉環。

而在這種整合完成、Qwen模型團隊分割成多個水平團隊後，留給林俊暘的位置和空間變得有限。在劉大一恒繼續擔任預訓練負責人、周浩擔任後訓練負責人的情況下，林俊暘原定的位置成迷，且職責範圍相比於之前「一手抓訓練、模型」的情況，壓縮到分管某個領域的位置。

可以預見的是，在完成組織架構調整後，阿里還需要一位類似姚順雨、吳永輝之類的技術大牛，來把控這個進一步擴大、拆分的組織架構。

至此，林俊暘和阿里，走到了不得不分手的岔路口。

在AI時代，核心頂級人才從來不缺機會，也擁有比普通人更理想的追求；但在時代的鉅變前，科技巨頭需要把握根據趨勢不斷調整方向盤，以確保整體的利益最大化。這裏沒有絕對的對與錯。

我們祝願林俊暘能夠在「狂飆」的AI大模型行業中，找到自己的位置；也祝阿里在下定決心修整組織架構後，能夠做出心目中的Qwen-4，在旗艦模型中找到自己理想的生態位。

免責聲明：投資有風險，本文並非投資建議，以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請，作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考，不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證，投資者應自行研究並在投資前尋求專業建議。

老虎證券

阿里千問變局：天才與巨頭的分叉口

熱議股票