阿里千問變局:天才與巨頭的分叉口

光錐智能
03/06

本文來自微信公衆號:光錐智能,作者:關注前沿科技的

3月4日凌晨,林俊暘在X上發布「me stepping down.bye my beloved qwen」,那時他是否會想到如此之大的輿論震動,我們不得而知。

但在前一天宣傳模型,後一天就宣告離開的情況下,千問大模型(下稱Qwen)裂開了一條縫隙,外部得以嗅到來自阿里內部變化的氣息。

一天後,阿里集團CEO吳泳銘簽發了林俊暘的離職令,並以前所未有的姿態組建了一個由集團最高權力核心構成的「三人小組」,這個三人小組包括吳泳銘、阿里雲CTO周靖人和現任餓了麼董事長兼CEO的範禹,共同接管Qwen資源調度的問題。

放在今天,Qwen在中國開源生態的貢獻上有目共睹,但帶頭做出Qwen2.5、Qwen3系列模型的兩個技術負責人周暢和林俊暘,先後離開了阿里。

在這場離職風暴的中心,隱藏着一個關於「實驗室理想」與「AI帝國」如何註定分離的命題:

阿里需要的,是一個能夠證明阿里AI實力的先進模型,為阿里拿下AI時代的新入口;一個能在MaaS戰場上,為阿里雲收割付費Token消耗的穩定引擎。而林俊暘追求的,是極致的開源精神和垂直整合的組織架構。

兩者的故事中,誰都沒錯,但林俊暘和阿里,已經逐漸來到了分道揚鑣的岔路口。

告別Qwen

周暢和林俊暘先後出走的背後

要理解這場離職風暴的深層邏輯,需要將時間撥回更久以前。

在林俊暘之前,阿里巴巴在大模型領域已經經歷了一次核心人才的變化。

第一次,以周暢為首的AI團隊跳槽,是阿里Qwen團隊技術骨幹出走的一個關鍵節點。

曾作為阿里P9級別員工的周暢,選擇加入了字節跳動。據悉,加入字節後,周暢不僅獲得字節4-2職級,相當於連跳兩級,且薪資高達千萬級別,比之前翻了好幾倍。

周暢的離職,不僅是因為薪資,一部分原因也在於對個人對技術路線的偏好。據晚點LatePost報道,彼時的周暢看好多模態方向,但放在2024年,也就是大廠集中押注大語言模型的情況下,周暢看中了字節視覺團隊拋來的橄欖枝。

人才的流失,顯然引起了阿里的警覺。作為接過周暢重任、擔任阿里Qwen模型團隊的技術負責人,從校招P6級別進入阿里,到幾年內多次升職,林俊暘成為了阿里最年輕的P10級別員工。

用馬雲的話說,離職無非兩種原因,一是錢沒有給到位,二是「心委屈了」。林俊暘的走,顯然屬於後一種。

3月4日凌晨,林俊暘在X上宣佈離職,到第二天阿里批准離職。兩天時間內,通過阿里員工發言和媒體報道,基本已經還原出林俊暘的離開,其中難免有和阿里組織的摩擦問題。

最影響到Qwen本身發展的,可能是對團隊內部資源不足的摩擦。

一個小切口是,林俊暘需要牽頭為Qwen碼來更多資源,難免對Qwen團隊內部是否為AI Infra額外投入、投入多少的想法不同。

林俊暘本人對Infra非常看重,這一點,他也在公開場合強調過。

「今天還有一個激動人心的事情,算法和Infra聯合優化的事情是真真實實存在的。」林俊暘在AGI-Next峯會上說,「除了像DeepSeek提到的提升訓練效率、節省資源成本外,我們要完成難度高的任務,都需要Infra的相關支持。」林俊暘說。

雖然阿里有額外的機器學習平台PAI負責提供這部分的支撐,但在林俊暘看來,還需要進一步加碼,比如在團隊中招聘更多相應人才。在林俊暘的社媒平台中,也公開放出過招聘Infra相關人才的信息。

林俊暘在社交媒體上招RL Infra崗位人員

對Infra的看重,不只是林俊暘對阿里的判斷。落在今年對AI失意的騰訊身上,Infra也成了「天才少年」、OpenAI前研究員姚順雨加盟後的重點之一。

在光錐智能此前的文章《騰訊重構AI的1000天》中,也曾提及,在騰訊年會上,內部表示,此前模型訓練的一些問題原因可能在於基礎設施Infra的不足。在姚順雨進入騰訊後,公司單獨成立了AI Infra部門和AI Data部門,區別於之前的部門架構,TEG中和AI訓推相關的工作不再和其他業務合併,而是獨立為AI服務。

但在後期,林俊暘希望自建Infra的實現並不順遂。在晚點播客中,提及林俊暘為了達成相關目標,發生了越過周靖人向阿里集團CEO兼阿里雲CEO吳泳銘尋求HeadCount(正職名額)的情況。所幸最終,林俊暘如願以償。

至於在其它資源上的不足,在3月4日阿里內部召開的會議中,阿里也承認了這一點。據智能湧現報道,關於招聘問題、內部算力有限問題,周靖人表示,團隊處於「資源緊張狀態」,內外差異有很多歷史原因,未來會進一步規劃。

發力頂尖模型

阿里對內動刀

在「為什麼做」的問題上,阿里與林俊暘之間同樣存在深刻的裂痕。

作為純技術人才,林俊暘在Qwen開源模型名氣的打響上,起到濃墨重彩的一筆。也是在AGI-Next峯會上,林俊暘曾經分享過團隊為什麼會考慮做小尺寸模型,起始是因為團隊中有人曾建議開源用於預訓練試驗的1.8B小尺寸模型,會對一些開發者起到幫助。

林俊暘

林俊暘對開源政策的激進,也在公開發言中有所體現。他曾表示,自己希望推進Qwen3-Max大模型的開源,但未能如願。

「全尺寸、多模態、重開源」的策略,幫助阿里在開源社區中建立了無可匹敵的生態優勢。以最新發布的Qwen3.5為例,除了最先開源的版本,阿里還後續發布了Qwen3.5系列的0.8B、2B、4B和9B四款小尺寸模型,在X上獲得了馬斯克的讚好。

但在阿里的視角中,從追求AGI的願景上,阿里需要的是一個能夠領先於「六小虎」和字節、騰訊的多模態大模型;於阿里雲需要靠MaaS擴張業務的情況下,集團希望有一個能打的大模型,像Kimi K2.5、字節豆包模型那樣,在API上收入進一步擴大。

在Qwen核心人員百餘人、資源有限的情況下,Qwen系列的旗艦模型在國內大模型混戰中,無法做到在所有系列中都拿到最好成績。

以最新發布的Qwen 3.5旗艦模型為例,作為一個參數397B的原生多模態大模型,講究「力大磚飛」的情況下,讓它和月之暗面萬億參數級別的Kimi-K2.5放在一起比分數,似乎有些尷尬。在Coding當前更看重模型質量階段,Qwen3.5雖然做到了性價比優勢,但它不是當前「掰腕子」的核心。換言之,Qwen3.5的發力和阿里內部的期許,走偏了。

回顧之前Qwen2.5、Qwen3系列大模型,阿里當前在模型生態上的成績有目共睹,甚至被稱為「源神」。但在大模型發展如此迅速的情況下,阿里也依然很着急。

出於對AI的焦慮,挖人、組織架構的調整,就變成了順理成章的思路,這一點在大廠上,基本是必選項。

谷歌擔任L7級別、參與Gemini研發的周浩,是阿里從硅谷挖回來的人才。據悉,周浩將接手的是Qwen團隊的後訓練負責人一職,這也對應了前後訓練負責人鬱博文的離開。

人才是第一步,接下來,阿里將到對準內部,開始對組織架構動刀。據悉,這也是引爆林俊暘和阿里衝突的導火索之一。

多家媒體報道,通義實驗室近期計劃將Qwen團隊分拆,從涵蓋不同訓練流程和模態的「垂直整合」體系,變成預訓練、後訓練、文本、多模態等一個個分開的水平分工團隊。更進一步的是通義實驗室內部之間的合併,比如將Qwen負責圖像模態的部分併入負責圖像生成的通義萬相。語音模型部分併入通義百靈。

但在林俊暘之前所在的架構來說,他更堅信「垂直整合」的思路——將模型訓練的全流程,從數據處理、架構設計、預訓練、後訓練到推理部署,都控制在同一個團隊內部,形成高度協同的閉環。

而在這種整合完成、Qwen模型團隊分割成多個水平團隊後,留給林俊暘的位置和空間變得有限。在劉大一恒繼續擔任預訓練負責人、周浩擔任後訓練負責人的情況下,林俊暘原定的位置成迷,且職責範圍相比於之前「一手抓訓練、模型」的情況,壓縮到分管某個領域的位置。

可以預見的是,在完成組織架構調整後,阿里還需要一位類似姚順雨、吳永輝之類的技術大牛,來把控這個進一步擴大、拆分的組織架構。

至此,林俊暘和阿里,走到了不得不分手的岔路口。

在AI時代,核心頂級人才從來不缺機會,也擁有比普通人更理想的追求;但在時代的鉅變前,科技巨頭需要把握根據趨勢不斷調整方向盤,以確保整體的利益最大化。這裏沒有絕對的對與錯。

我們祝願林俊暘能夠在「狂飆」的AI大模型行業中,找到自己的位置;也祝阿里在下定決心修整組織架構後,能夠做出心目中的Qwen-4,在旗艦模型中找到自己理想的生態位。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10