Qwen將面臨調整:資源更多,繼續保持開源,既要追求性能和開源影響力,又要與千問APP高效協同,這是接下來的關鍵。
懂財帝出品 · 作者|嘉逸
3月7日凌晨,林俊暘在朋友圈發文,正式告別阿里。
他是阿里內部培養起來的AI領軍人才,是AI基礎大模型千問(Qwen)的核心掌舵者,也是阿里最年輕的P10。
他的突然離職,迅速激起「人事地震」,多位技術骨幹相繼出走,包括:惠彬原(Qwen代碼方向負責人)、鬱博文(Qwen後訓練研究負責人)、李凱鑫(Qwen 3.5/VL/Coder的核心貢獻者),以及多位年輕研究員。
內外部質疑,紛至沓來,以至於阿里CEO吳泳銘、CPO蔣芳、阿里雲CTO周靖人等高管,親自出面對話、答疑、承認溝通失誤。
儘管吳泳銘表態,將成立基礎模型支持小組,親自掛帥,並提供通暢交流的通道。但「AI軍備競賽」以周迭代,核心人才突然流失,大概率會擾動研發節奏。
《智能湧現》援引一位投資人的話,稱:如果這一批人真要是離開了,Qwen模型至少得耽誤半年到一年,重組團隊重新訓。[1]
阿里All in AI,如今,基礎設施震盪,千問尷尬地站在了「十字路口」。
背後,能看到阿里AI需求的轉變:AI基礎大模型,從打造全球技術影響力,正逐漸轉向支持以千問APP為核心的內部業務,支持商業化。
而就在戰略調整的過程中,超級AI個體的技術理想,與阿里集團的文化、組織、技術路線、商業化目標,爆發了衝突。
01 | 100多人的「特種部隊」,做到全球開源第一
有AI行業人士評價,林俊暘值1億美金。他離職後,谷歌DeepMind高管「隔空喊話」挖人。
林俊暘,曾經歷過阿里內部賽馬,是能打仗的AI技術負責人。
他是北大計算語言碩士,畢業後加入阿里達摩院,研究自然語言處理。
次年,達摩院研究大語言模型,內部賽馬,周暢、林俊暘等人所在的M6項目勝出,成為Qwen系列模型的基礎。
2022年底,通義實驗室成立,林俊暘負責Qwen模型開源工作。
2024年7月,周暢奔赴字節,林俊暘接班,獲得重用,全面接管Qwen大模型的預訓練、後訓練等全流程。
多位行業人士、媒體人士透露,林俊暘踏實,擁有高度的自驅力。他成為P10後,依然願意為了用戶反饋,親自去修Debug。[2]
晚點LatePost援引相關人士的話,稱,林俊暘不是那種苦大仇深的負責人。他更傾向於設定明確的「靶子」,儘可能減少不確定性。[3]
正因此,他只率領了一支100多人的「特種部隊」,就做到了全球開源第一。
過去幾年,Qwen大模型高頻迭代,完成了從7B到72B的全尺寸開源,去年發布的Qwen3-Max,評測數據更是超越同期國際主流模型。
今年3月初,Qwen3.5系列的小尺寸模型開源發布後,馬斯克迅速讚好,並表示:Impressive intelligence density(智能密度令人印象深刻)。
截至目前,Qwen系列模型全球活躍度最高,下載量已超過10億次,衍生模型超過20萬,是全球開源模型第一家族。
更值得注意的是,這一成績,是在極其矛盾的狀態下取得的。
主觀上,對於林俊暘和其他Qwen骨幹,周靖人一直採取放權、給空間的策略,考覈體系也更為寬容。[4]
但客觀上,資源有限。Qwen僅有100多人,整個通義實驗室有600多人,字節AI大模型Seed團隊已超過1500人。
同時,Qwen的算力資源長期緊張,阿里雲人工智能平台PAI無法提供足夠的AI Infra支持。
這也導致Qwen 3系列和Qwen 3.5系列,部分核心指標並不突出。Qwen3.5 Plus,更是被一位阿里高管稱為「半成品」。
對此,在通義實驗的All Hands會議上,千問員工質疑:為何阿里投資的AI公司,購買阿里雲算力用得順暢,內部團隊反而在算力、招聘名額上捉襟見肘?
阿里雲CTO周靖人回應道,團隊處於「資源緊張狀態」,內外差異有很多歷史原因,未來正在做整體規劃,但沒有進一步展開說明。
02 | 超級AI個體與阿里集團的衝突
林俊暘,是阿里內部成長起來的AI核心人才,技術、管理過硬。
作為阿里最年輕的P10,他獲得了超額升遷。網傳,他的年薪(包括股權激勵等)高達500萬以上。
即便他的公開發言使阿里陷入被動,但高層仍對他進行了明確挽留。
這樣一位超級AI個體,為何「衝冠一怒」?矛盾,是如何爆發的?
最核心的原因,是林俊暘的技術理想與阿里集團的AI戰略、商業化現實,起了衝突。
AI發展早期,阿里希望打出全球技術影響力,吳泳銘、周靖人等中高層,自上而下,堅月供入,甚至不計ROI,全力支持Qwen大模型開源。
但進入2025年,AI雲爆發,疊加AI超級入口爭奪戰,阿里顯著承壓。
To B的AI雲業務方面,儘管阿里雲營收規模依然領先,但字節火山引擎正強勢崛起。據IDC統計,2025上半年,火山引擎對外調用量(Tokens)市佔率49.2%,阿里雲27%。此外,火山引擎還從阿里雲手裏「截胡」了理想汽車等大客戶。
2026年,阿里雲立下「軍令狀」,希望拿下中國AI雲市場增量的80%。
然而,Qwen卻在自建AI Infra。對於阿里雲來說,難以接受,內部的AI大模型都不用自己的AI雲基礎設施,外部客戶怎麼會用?
To C,AI超級入口爭奪戰中,千問APP已成為阿里的「最高優先級」。從馬雲到吳泳銘,都親自站台支持。
對「基礎設施」Qwen大模型的要求也隨之明確:協同支持千問APP。
但林俊暘卻希望,訓練出更強、更高效的模型。去年底,他定下的目標是,讓Qwen模型對標Gemini,在國際上的影響力更進一步。[5]
因此,去年9月(千問立項)後,Qwen團隊幾乎每個月,都至少保持一次重大更新。進入12月,模型更新速度進一步提升至「周更」,全球人氣越來越高。
與此同時,Qwen大模型對千問APP的支持,明顯不夠。
虎嗅援引一位相關人士的話,稱,有阿里高層反饋了千問APP的幻覺問題,但解決時間令他驚訝,本質是基礎模型上缺少相應的功能,基礎模型與AI應用未能同頻奮戰。
對此,有高層人士表示了不滿。[4]
至此,在大公司中,林俊暘實際已處於危險地位。
到了3月3日,矛盾徹底爆發。一方面是組織架構全面調整,阿里希望Qwen團隊能按照預訓練、後訓練、視覺理解、圖像等維度拆分。其中,一些團隊,如後訓練團隊,會和千問APP深度合作並共享戰術目標。
這與林俊暘的技術理念並不相符,他一直主張語言、代碼、多模態等方向的員工一起工作,來提升模型訓練效率。
另一方面是人事變動,周浩空降,將負責後訓練團隊,並直接向周靖人彙報。這也意味着,林俊暘的管理權限,將大幅壓縮。
內外因素交織,林俊暘——這位超級AI個體情緒爆發,決定出走。
如今,事已終結,個人的技術理想,終歸無法抗衡大公司的商業化現實。
Qwen將面臨調整,資源更多,繼續保持開源,既要追求性能和開源影響力,又要與千問APP高效協同,這是接下來的關鍵。
03 | AII in AI,還是商業優先?
對於這場風波,阿里和林俊暘,都沒準備好。
尤其是阿里Qwen大模型,在「掌舵者」和技術骨幹相繼離職後,還能否繼續保持領先?如何助力千問APP爭奪AI超級入口?
據晚點LatePost報道,3月9日下午,Qwen管理調整出爐:周靖人代管Qwen模型一號位,負責預訓練的劉大一恒,同時代管後訓練和Coding團隊。
這意味着,預訓練、後訓練和Coding,依然在同一個團隊內緊密協作,並未拆分。[6]
再回過頭來看,這場風波,本可以避免。
阿里All in AI,但2025Q2、Q3,在外賣業務上燒了近500億元。今年春節,千問砸錢超過30億元。或許,少發幾個紅包,就足以支撐AI大牛的技術理想。
這不禁讓人懷疑,AI和外賣大戰,到底誰更緊迫?
一個分析視角是,外賣市場份額和APP的用戶數據,更加直觀。目前,淘寶閃購市場份額已超過40%,千問APP月活超過2.03億,增速552%,僅次於ChatGPT和豆包。
而AI開源大模型,業績無法量化,並且全球科技廠商正逐漸轉向閉源。沒有公司會真的把所有籌碼,押注到一個還不完全確定的事情上。
另外,大公司內部,更強調協同、流程、服從大局,而AI大牛往往特立獨行。
AI時代的競爭,實質是人才的競爭。對此,阿里正在反思,最新消息是,將探索針對90後、00後年青一代AI技術人才新的培養、升遷、管理方法,強化開放透明的溝通渠道,鼓勵創業精神、開拓精神。
同時,阿里將幫助年青一代更深刻地理解、融入阿里家庭和文化,協作意識、集體意識依然是必要的。[4]
這,是典型的「既要、又要、還要」,現實該如何解題?
阿里已成立27年,員工超過12萬人,如今必須招募更多的AI人才。在巨大的文化慣性下,它能否能平衡好大公司和AI人才、創新和商業化之間的微妙關係?
一場技術理想與商業現實碰撞之後,集AI基礎大模型與應用端APP於一體的千問,再次站在了「十字路口」。
參考資料:
[1]. 林俊暘提出離職後,阿里高管緊急答疑-智能湧現
[2]. 別了,阿里林俊暘-01Founder
[3]. 林俊暘離職風波始末:AI技術負責人與大公司的成長與分歧-晚點LatePost
[4]. 阿里能從「林俊暘時刻」學到什麼?-虎嗅APP
[5]. 靖人成為阿里合夥人,通義實驗室持續調整應對激烈競爭-晚點LatePost
[6]. Qwen 管理調整出爐:周靖人代管千問模型一號位,劉大一恒管理更多團隊-晚點LatePost