
既要、又要、還要的 AI 管理難題。
文丨 陳佳惠 管藝雯 賀乾明 程曼祺
編輯丨程曼祺
林俊暘提交離職引發一系列後續:阿里數名管理層連夜緊急討論;第二天(3 月 4 日) Qwen 召開全員會;昨天(3 月 5 日)上午,吳泳銘給 Qwen 全員發郵件,稱已批准林俊暘辭職;昨天下午,林俊暘回到阿里北京辦公區,給部分團隊成員做 1on1。
《晚點 LatePost》獨家了解到,3 月 4 日凌晨,阿里管理層主要討論了兩個內容:怎麼解決問題?林俊暘的離開會給公司帶來哪些影響?
他們達成了共識:這樣的行為不可接受,公司組織制度必須得到維護。
據我們了解,林俊暘發出離職狀態時,阿里並未回應他的離職請求。
一位阿里人士稱,「制度是不能碰的,而他在挑戰公司制度。」 這裏的 「制度」 指 —— 在阿里,所有人都是公司員工,升和降都由公司決定,如果不滿可以正常溝通,但不能沒溝通就到社交媒體公開發聲,不能開這樣的先例。
林俊暘在阿里工作了 7 年,這是他的第一份工作。林俊暘意料之外的驟然離職,背後是每一個深度參與 AI 競爭的大公司都會面臨的管理難題。
一邊是推動 AI 發展的開拓精神、超級個體和極致效率,一邊是大公司的整體目標和對業務協同的強調,二者之間的張力在此時的阿里集中爆發。
林俊暘提交離職的 48 小時,對阿里、對他本人都是一個意外
「無顏再帶領大家。」 林俊暘 3 月 3 日下午在有 100 多名 Qwen 成員的釘釘羣中發出消息。
這之前不到 24 小時,林俊暘還在繼續他作為 Qwen 負責人和 「最強開源佈道師」 的日常活動:加班加點發布 Qwen 的新模型和技術報告,凌晨在社交媒體上推廣剛上線的 Qwen 3.5 小模型系列,轉發馬斯克的相關評論。
而 3 月 3 日下午的一場溝通改變了林俊暘的軌跡。突如其來的強烈離職意願,可能對他本人來說都是一個意外。
據了解,當天下午,阿里雲 CTO 周靖人和林俊暘連線開會,向他傳達了可能發生的 Qwen 的調整。每年 3 月底,阿里傳統上會做績效年度考覈和架構調整,這場溝通很可能是為 1 個月後的變化做鋪墊。
當時提到的調整方向是將 Qwen 團隊重組,從涵蓋不同訓練流程和模態的垂直整合體系,變成預訓練、後訓練、文本、圖像、語音等一個個分開的水平團隊。
「下午開會的時候,林俊暘的情緒已經很激烈。」 接近此事的人士稱。
當天下午,還發生了另一件事。3 月 3 日剛好是 Qwen 原後訓練負責人鬱博文的最後一個工作日,在 HR 召集的後訓練團隊 「歡送會」 上,該團隊第一次得知,2026 年 1 月新加入阿里的周浩將參與管理 Qwen 的後訓練成員。周浩此前是 DeepMind 高級資深研究員,曾領導針對 Gemini 3.0 的多步驟強化學習。
據我們了解,林俊暘在本周之前並不知曉周浩已入職,周浩彙報給阿里雲 CTO 和通義實驗室負責人周靖人。
阿里相關人士稱,之所以周浩入職一事之前沒有同步 Qwen 團隊,是因為引入海外人才有一定敏感性,保密等級較高。
當天下午稍晚,在周靖人和林俊暘的溝通後不久,林俊暘在 Qwen 釘釘羣裏發出了 「無顏再帶領大家」 的信息,表示自己只能離開了。
到這一步,整個事件還在阿里公司內部。而 3 月 4 日凌晨林俊暘的那條社交媒體動態則直接向外界宣告了他的離職意向。
13 小時後,3 月 4 日下午 1 點。阿里召開 Qwen 團隊的全員會,阿里 CEO 吳泳銘、CPO 蔣芳、阿里雲 CTO 周靖人出席。在杭州的團隊集中在線下參會,北京和上海團隊接入視頻會議參會。
「這個會本來也是要和大家開的,只不過現在稍提前了一些。」 阿里 CEO 吳泳銘說。全員會持續約 1 個半小時,吳泳銘在會議開頭重申了在集團戰略上會全力支持 AI,此後大部分時間留給團隊提問、答疑。
Qwen 團隊成員關心的核心問題有:
- 林俊暘的離開是否有轉圜餘地?
蔣芳說:集團會挽留林俊暘。在數個 Qwen 成員表達了林俊暘的重要性後,蔣芳又回應,不能神化個人,不能不計代價和不理性地挽留。她隨後問團隊:那麼大家期待以什麼代價來挽留俊暘呢?沒有人回答這個問題。
- 團隊是否會調整?周浩加入為什麼沒有提前告訴大家?
周靖人回應,周浩加入並不是要替代誰。周浩加入這件事沒有提前告訴大家,是因為當時團隊在忙着訓練 Qwen 3.5,所以暫時沒溝通。
- 關於 Qwen 團隊缺少資源
吳泳銘說,他是中國最激進尋找算力的 CEO,可能一些問題沒有及時反饋到他這裏。
團隊也反映,Qwen 3 的 Coding 能力欠佳,與沒有得到足夠的訓練環境等資源有關,這需要 CPU 資源和 Infra 人才支持。周靖人回應,資源問題和 Infra 支持不到位有 「歷史原因」。
全員會上,吳泳銘還承諾,之後每半個月到 1 個月,他會和 Qwen 團隊或 Qwen 核心人員開會,及時了解需求或問題。蔣芳說大家可以直接在釘釘上私信吳泳銘、蔣芳、周靖人,反饋問題。
當天下午 2 點,林俊暘發布朋友圈:「qwen 的兄弟們,按照原來安排繼續幹,沒問題的」。
全員會第二天,3 月 5 日上午。吳泳銘給 Qwen 全員發送郵件,稱已接受林俊暘離職。郵件還提及,阿里會繼續堅持開源模型策略;周靖人會繼續帶領通義實驗室;吳泳銘、周靖人和阿里集團 CTO 吳澤明(範禹)會共同協調集團資源,支持基礎模型建設。

林俊暘的離職引起一連串外部反應。Google DeepMind 的開發者體驗負責人在社交媒體上邀請 Qwen 成員加入:「如果你想找到構建好模型和貢獻開源社區的新家」。

Omar Sanseviero 曾任職於 Hugging Face,現任 Google DeepMind 開發者體驗主管。
有其它公司高招人員在林俊暘宣佈離職的那晚整夜沒睡,挨個給認識的 Qwen 團隊成員發工作邀請;有獵頭想聯繫林俊暘,列出了具體哪些公司有崗位找他。
不少投資人在尋求 Qwen 核心人員的聯繫方式,他們認為可能有更多離職發生,可能有人會創業。
當小團隊開始承擔更大的組織目標
2023 年以來,AI 成為阿里的戰略重點。新上任的掌舵者吳泳銘當年 11 月第一次作為 CEO 參加財報會,提了 40 次 AI。阿里集團內一度有多個團隊嘗試 AI,如淘天就曾有 20 個 AI 團隊。2022 年底到 2023 年初,達摩院多數團隊重組為通義實驗室,也是要整合各種力量來做 AI。
在這個大環境下,Qwen 是一個相對獨立的小團隊,它脫胎於這輪 AI 熱潮之前的達摩院智能計算實驗室的 M6 項目。當時周靖人是智能計算實驗室負責人,而 2019 年入職阿里的林俊暘是 21 年 3 月發布的大模型 M6 的一作。
到 2023 年初,同在通義實驗室的 M6 團隊和 NLP 團隊一度在賽馬做大模型,起步時都有約 500~1000 張 GPU 算力資源。同年年中,通義實驗室以 M6 團隊為主聚集了人員和算力資源,Qwen 在此次變動前的核心成員——林俊暘、劉大一恒、鬱博文、惠彬原等人在此時組隊,其中劉大一恒、鬱博文、惠彬原原本在 NLP 團隊。
周靖人作為通義實驗室整體負責人,給了 Qwen 團隊相對獨立的空間。多位曾在 Qwen 工作的人士告訴我們,「感謝靖人給我們充分發揮的空間」。
同時,吳泳銘和周靖人都支持 Qwen 團隊的開源想法。這是一個重大的戰略決策,必須得到自上而下的認可。
Qwen 目前有 100 多名成員,整個通義實驗室有 600 多人。字節模型研發團隊 Seed 目前則有超過 1500 人。
相對獨立的另一面是,整個阿里雲和阿里集團的 AI 佈局並沒有完全押在自研基礎模型上。阿里當時的思路是做 AI 基礎設施:提供 AI 雲、MaaS(Model as a Service)服務,建設魔搭模型社區等生態。
阿里投資了中國多家大模型公司,為它們提供算力。這一定程度引發了內部團隊的不滿:算力如此珍貴,為什麼還要大量供應給外部?
字節跳動則在 2024 年年中明確決定,不對外投資任何大模型創業公司,集中資源到 Seed 團隊,自研大模型豆包,並支持字節自己的豆包等 AI 產品。
資源相對有限,但空間足夠時,團隊能力和闖勁成為關鍵變量。Qwen 的兩任負責人周暢、林俊暘都有 「自驅的高強度工作狀態」。
2024 年以來,阿里開源的 Qwen 系列大模型在全球的影響力持續提升。當年 10 月,其衍生模型數量達到 8 萬多個,超過更早開源的 Meta Llama 系列。
Qwen 以豐富的尺寸受到中小創業公司和研究機構的喜愛,不少知名公司,如 Cursor 等都會基於 Qwen 系列模型做微調和後訓練;Qwen 的多模態開源系列也是一衆中國具身智能公司選擇的基模。DeepSeek、字節跳動也會在部分研究項目中使用 Qwen 的小尺寸模型。
周靖人在 2025 年成為阿里合夥人,進入阿里最高集體決策機構;林俊暘在 25 年成為阿里最年輕的 P10 級高管。阿里管理層認為,通義實驗室努力保證了 Qwen 模型的領先地位,「這非常不容易」。
但也是 2025 年,有了更大影響力的 Qwen 開始承載更多期待,小團隊原本的目標和整個阿里集團的 AI 戰略開始分叉。
阿里集團看中 AI 雲的商業化增長和 25 年下半年逐漸白熱化的 AI 超級 App 卡位戰。
2024 到 2025 年,阿里雲的收入增速不斷提升,但和基模的協同並不直接:增長主要來自阿里投資的多家大模型公司的算力採購,和更多行業 AI 應用帶動的雲服務消耗。
2025 年 9 月,阿里集團決定重點推進千問 App,這需要基礎模型團隊與應用團隊更緊密地協作。我們了解到,Qwen 團隊並沒有把支持千問 App 放在高優先級。而負責千問 App 的智能信息事業羣也有自己的模型研究團隊。有阿里人士認為,Qwen 團隊對雲的其它業務、對千問 App 的支持不夠。
Qwen 則希望持續訓練出更強、更高效的模型。
Qwen 擴展了語言之外的更多模態,以順應原生混合多模態的技術趨勢,陸續發布 Qwen-image、Qwen-audio。這與同屬通義實驗室的通義萬相(主要做多模態生成)和百聆(主要做語音模型)有重合。
從 25 年年中起,Qwen 也開始招聘一些 Infra 人才。有 Qwen 團隊成員稱,當時 Qwen 在訓練新一代核心模型的大尺寸版本時發現,阿里雲 PAI 團隊已很難提供足夠的 Infra 支持。這讓為阿里雲帶來收入的 PAI 團隊處境尷尬,如果內部業務都不用他們,在競爭激烈的市場中會更難自證實力。
同期,2025 年至今發布的 Qwen 3 系列和 Qwen 3.5 系列的訓練過程都遇到波折,部分核心能力指標不突出。
原本計劃在節前發布的 Qwen 3.5 Max(每一代 Qwen 中尺寸最大的旗艦版)沒能準備就緒。Qwen 在除夕當天開源的 Qwen 3.5 Plus 模型,也被一位阿里高層視作 「半成品」。
小團隊的特立獨行和對技術領先的追求,集團期待更多戰略成果,競爭升級的外部環境,疊加模型訓練眼下的波折,出乎意料的人事震盪在此刻掀起風暴。
林俊暘其人:一個 「非典型」 大模型團隊負責人
在中國幾家大公司基礎模型團隊的負責人裏,林俊暘是特別的存在。他並非典型意義上的 「科班」 出身:本科是文科,碩士轉入更偏技術的交叉學科方向。
林俊暘的碩士導師、北京大學外國語學院副教授蘇祺曾評價他:「人文社科的學生也能從事,而且很好地從事跨學科研究工作。」
林俊暘生於 1993 年,本科就讀於國際關係學院英語文學專業,並同時學習日語、俄語、德語和法語,被同學稱為 「多語言學霸」。
本科期間,他擔任國關的模擬聯合國大會負責人。在當年的校園媒體訪談中,他說自己帶社團的核心是,不論社員負責什麼工作,「idea 才最重要」。他還把緊湊的活動場地設計視為特色,認為這有利於模聯各團隊的溝通,既能提高協作效率,也能減少不必要的勞力。
本科畢業後,林俊暘考入北京大學外國語學院,師從蘇祺和北京大學計算語言學研究所副教授孫栩,攻讀計算語言學碩士。讀研期間,他總共發表了 11 篇第一作者或共同一作論文,還擔任一個研究項目的負責人。
計算語言學是用可計算的方法,建模語言結構和語言使用方式。它要求研究者理解語言本身,又要求他們掌握算法、數據和建模能力。到了大語言模型時代,這個方向成為重要的研究人才來源之一。我們在 2025 年初分析 DeepSeek 數十位研究人員履歷時就發現,其中有 8 位出自北大計算語言學研究所。
2019 年碩士畢業後,林俊暘加入成立僅兩年的阿里達摩院,擔任高級算法工程師,研究自然語言處理。那時大模型技術路線正加速成形:Transformer 架構提出已兩年,OpenAI 的 GPT 系列模型開始展現超出預期的能力。
一年後,達摩院內有兩個團隊開始研究大語言模型。一個是由資深自然語言處理專家黃非負責的 AliceMind 項目;另一個則是由楊紅霞、周暢、林俊暘等人參與的 M6 項目,向周靖人彙報。最終,M6 的性能更強,也成為通義實驗室 Qwen 系列模型的基礎。
楊紅霞在 2022 年從阿里達摩院離職。通義實驗室成立後,林俊暘負責 Qwen 模型開源工作,向周暢彙報。也正是在這個階段,他逐漸從一個更偏研究和內部協作的角色,走向更容易被外部看見的位置。他開始頻繁活躍在海內外社交媒體,推廣 Qwen 系列模型,解釋模型更新,回應開發者反饋,推動社區認知。
隨着 Qwen 系列模型持續進步、影響力不斷擴大,以及周暢離職後他接替更核心的位置,林俊暘逐漸成了 Qwen 在技術社區鮮活和有說服力的推廣者。
「他不是那種苦大仇深的負責人。」 一位接近林俊暘的人士說。多位不同公司的大模型研究者,都用這個詞向我們形容過自己的部門負責人。
上述人士告訴我們,在條件有限的情況下,林俊暘認為首要任務不是追求完美,而是確保事情能落地,先把結果做出來,再談優化和迭代。
他並不認為負責人必須精通軟件編寫的每個細節;在他看來,更重要的是理解底層的 「物理邏輯」——知道事情為什麼這樣運轉,知道如何抓大放小。
正因為如此,林俊暘更傾向於設定明確的 「靶子」,讓一個團隊儘可能把事情都做了,儘可能減少不確定性,「不能讓團隊 ‘陷入虛無’。」
既要、又要、還要的 AI 管理難題
公司強調組織、流程、集體目標、指哪兒打哪兒的戰略執行力;而 AI 一線研究員是這個時代最聰明、自驅、有創造力和野心的個體。
公司要在多大程度上包容個人意志,AI 研發團隊是否要自建全棧閉環,以研發為核心的團隊要如何支持撲面而來的商業化階段和產品競爭,這些難解的題目沒有標準答案。
OpenAI 元老傑瑞·特沃雷克(Jerry Tworek)近期離職後說:OpenAI 已沒有做高風險研究的空間,「所有主要 AI 公司都面臨多重壓力,既要驅動用戶增長,又要承擔昂貴的 GPU 成本,還要拼模型的第一。」
風波之後,有管理層後來在內部提議,公司以後要加強管控高管們的個人社交媒體賬號,減少 「造神」 行為。一位接近阿里的人士對我們說,「原來是開放的時代,但管理層發現,真出事了怎麼辦?」
「組織要往前走,事情要發展,不能做調整了麼?經歷一些調整,就用這種方式,放在任何地方都說不過去吧。」 一位阿里人士稱。
極端情況下,阿里亮出了底線:個人意志要服從組織需求。
曾經,林俊暘擁有的是阿里為其主動留出的表達空間,帶有 「阿里最年輕 P10」 的標籤,他在境內外社交媒體上頻頻發聲,既開拓了 Qwen 基礎模型的開源影響力,又能作為已成立 27 年的阿里年輕化的最佳代表。阿里在研發人才心中的印象為之一變。這個組織也為開源精神和技術理想留出了足夠的彈性。
而林俊暘從提出離職到在公開社交媒體上發聲只有半天,沒有給阿里管理層繼續溝通和反應的空間。他對 Qwen 要自建閉環的想法,他希望集中有限資源做模型,Qwen 團隊暫難支持 AI 產品的事實,也被阿里其它團隊認為合作意識不足。
如果沒有這份執念和對核心目標的聚焦,可能 Qwen 一開始就難以自證;但當團隊更大,阿里集團需要基礎模型團隊承擔更多角色,AI 競爭也進入新階段後,Qwen 團隊不得不重校目標,調整與公司、與其它團隊的關係。
這是公司組織和年輕的 AI 技術負責人共同面臨的成長課題。
以往,阿里常常處於過於嚴厲和過於寬鬆的兩端。一位接近阿里技術高層的人士說:「Qwen 不能算阿里的邊緣業務,而是早期就得到重點投入,甚至優先級高於部分阿里雲業務。後期 Qwen 忽視業務,同時展示出 ‘自建一切’ 的傾向,恰恰是因為早期重點投入帶來的特權意識和大廠政治。如果前期就更加平衡純研究、工程和業務之間的協作,事不至此。」
某種程度上,這幾天的劇烈衝突劇目,是阿里自己按下的啓動鍵。一直以來,對一家大公司,可控永遠是紅線。
題圖來源:Severance