文|鄧詠儀
編輯|蘇建勳 楊軒
來源|智能湧現(ID:AIEmergence)
封面來源|企業官方
「我應該要更早知道這些。」
北京時間3月4日下午約13:00,通義實驗室緊急召開了All Hands會議,阿里集團CEO吳泳銘向千問員工坦誠表示。
12個小時前(北京時間3月4日凌晨0點11分),阿里千問大模型技術負責人林俊暘在X上突然宣佈離職——林俊暘是阿里AI開源模型的核心推手,也是阿里最年輕的P10之一——行業一片譁然之時,Qwen的部分成員也無法接受團隊靈魂人物的突然出走。
「在資源遠少於競對的前提下,能取得今天的成績,俊暘的領導力是核心因素之一。」不止一位千問成員對智能湧現評價。
在會上,以劉大一恒(Qwen RL leader)為代表,部分Qwen成員圍繞包括團隊拆分、新成員周浩、對模型路線選擇、資源投入等等維度,對阿里高層提出了多項疑問。
這場會議與會者包括阿里數位高管、Qwen團隊以及通義實驗室其他團隊成員。圍繞團隊調整、戰略方向等關鍵議題,包括阿里巴巴CEO吳泳銘,阿里巴巴首席人才官蔣芳、阿里雲CTO周靖人做出多個回應。
對於此次調整,阿里高層給出的核心定性是:Qwen沒有收縮,這是一次團隊擴張,無關任何政治鬥爭,反而需要投入更多資源。
「我們在快速發展,這波調整是為了擴充更多人才、提供更多資源。」阿里巴巴首席人才官蔣芳也承認溝通存在不足,「這次組織形式沒溝通好,新人引入肯定會帶來陣型變化,擴大過程中必然涉及到這些,我們可能沒處理好。」
有傳言稱周浩將直接領導林俊暘及其相關團隊,但據智能湧現獲悉,包括周浩的接任職位,彙報線,尚在討論中。
會上,阿里高層強調多次,千問基礎模型是集團當前最重要的事情,大模型的競爭不僅僅是Qwen團隊的事,而是整個阿里集團的事——無論是基礎模型研發,還是底層infra建設,都將在集團層面統籌推進,「一定要超越」。
阿里雲CTO周靖人則回應了包括招聘名額、算力短缺等尖銳問題:為何外部客戶(如大模型創業公司)購買阿里雲算力用得順暢,內部團隊反而在算力、招聘名額上捉襟見肘?
周靖人表示,團隊處於「資源緊張狀態」,內外差異有很多歷史原因,未來正在做整體規劃,但沒有進一步展開說明。
關於林俊暘的動向,會上也沒有更新的結論。但下午2點左右,林俊暘再度發布朋友圈,表示「qwen的兄弟們,按照原來安排繼續幹,沒問題的」,並未明確是否迴歸。
而在數日前,阿里啱啱完成一輪AI戰略更新,內部將AI的總稱和核心品牌統一為千問,組織層面也迎來了新一輪調整。
「智能湧現」了解到,此前Qwen擁有自己的預訓練、後訓練、Infra團隊;從模型模態上看,也有語言模型、多模態、代碼等多個方向。
過往,訓單模態模型曾是業界主流。然而,隨着對視覺理解需求的日益增長,視覺語言模型(Vision Language Model)應運而生,這也使得各個模態的深度融合成為一大發展趨勢。
一位知情人士曾對「智能湧現」表示,從2025年開始,林俊暘就在尋求讓Qwen內部的語言、圖像、視頻、代碼等方向的員工一起工作,以尋求提升模型訓練效率。Qwen團隊曾提出與萬相團隊合併,但沒有完成,纔開始做了自己的qwen-image模型。
但在這輪調整中,通義實驗室希望將Qwen團隊按預訓練、後訓練、視覺理解、圖像等維度拆分,和通義實驗室中的團隊合併(如通義萬相、通義百聆等團隊),一起工作。但在沒有充分信息溝通的情況下,矛盾就此爆發。
「林俊暘,
他一個人就值一億美金」
就在3月2日晚間,千問還在X上宣佈開源四款Qwen 3.5小尺寸模型,馬斯克讚好了這條推文,並表示「令人驚歎的智能密度。」
千問模型靈魂人物林俊暘毫無徵兆地突然提出離職,讓Qwen團隊陷入迷茫。
在前任阿里千問技術負責人周暢離職後,生於1993年的林俊暘從2022年起開始接手阿里Qwen團隊,負責整體技術工作。
這幾年間,阿里Qwen模型家族也在快速發展,從最開始的通義模型家族到Qwen 2.5、Qwen 3.5等系列模型,在多個維度上,Qwen都是毫無疑問的開源模型第一家族,阿里也一路成長為世界一流模型團隊。
多位前阿里模型團隊人士對「智能湧現」都曾表示,2023年國內大模型剛起步時,國內大廠對是否開源、開源力度多少也有分歧。但阿里的開源戰略做得足夠早,足夠有戰略定力,周暢、林俊暘等人在其中發揮了積極推動作用。
而隨着林俊暘離開,一同宣佈離職的,還有多位Qwen成員,其中有負責Qwen各個模型細分方向的核心負責人,如:
惠彬原(Binyuan Hui):Qwen代碼方向負責人,Qwen-Coder系列模型主理人,負責從預訓練到後訓練的全流程Agent訓練,近期也有參與具身智能(Robotics)相關研究。
鬱博文(Bowen Yu):Qwen後訓練研究負責人,畢業於中國科學院大學,主導 Qwen-Instruct系列模型的開發。
Kaixin Li:Qwen 3.5/VL/Coder的核心貢獻者,畢業於新加坡國立大學。
除了上述幾位人員,還有數位年輕研究員,也在同一天提出了離職。
不止一位Qwen研究員在推特、小紅書發布情緒低落的推文。「Qwen is nothing without its people.」這番發言套用了2024年OpenAI陷入CEO更換風波時,OpenAI員工在推特上的刷屏發言。
林俊暘官宣離職在AI社區引起了巨大轟動,很多反饋來自海外開發者,均在表達對林俊暘推動Qwen開源工作的感謝。「一個時代的結束。」Hyperbolic Labs創始人兼CTO Yuchen Jin表示。
「如果這一批人真要是離開了,Qwen模型至少得耽誤半年到1年,重組團隊重新訓。」一位投資人對「智能湧現」評價。另一位字節AI人士則稱「林俊暘至少是1億美金以上級別的人才。」
不少傳言稱,林俊暘離開是「非自願」,但經「智能湧現」確認,林俊暘在3月3日提出離職,並且還沒有和阿里談好相關的細節,Qwen團隊成員在3月4日下午得到的消息。
「智能湧現」最新得到的消息是,阿里巴巴高層還和林俊暘密切溝通中,林俊暘是否確認離開阿里巴巴還未可知。
林俊暘離開後,即將接手阿里Qwen後訓練工作的新成員,是來自Google DeepMind的周浩。一位Qwen團隊人士對「智能湧現」稱,周浩於2026年1月短暫入職夸克,而後調至通義實驗室。從彙報線上看,周浩直接彙報給周靖人,不少聲音稱,他將接手Qwen的後訓練工作。
周浩(Hao Zhou)本科畢業於中科大,博士畢業於威斯康星大學麥迪遜分校(UW-Madison)。據他的領英主頁,他曾於Meta工作3年,在Google DeepMind工作約4年,是Gemini 3.0模型的核心貢獻者,親自帶隊落地了帶工具與思考鏈的多步RL方向,並深度參與了Gemini 1.0、AI Mode及Deep Research等項目。
阿里在開源上贏了口碑,
但它還想要更多
就在3月3日,林俊暘啱啱在X(推特)上發布數款小尺寸的開源模型,這些模型適用於手機等,也貫徹了Qwen一直以來的開源路線。
很多人認為將做開源模型粗暴理解為「做慈善」,但這並不公允。
開源做得好,首先服務了整個阿里雲的開發者生態。因為更早做開源,Qwen模型家族在模型發展早期能夠快速得到社區反饋,成長迅速,反哺了模型訓練。
Qwen全尺寸、全模態的模型路線,讓很多企業、學校的技術從業者能夠很快選用到合適自己的模型,建立了一波好口碑。在這些模型落到生產環境後,很多企業主也會傾向於購買Qwen的模型服務,間接轉化成了阿里雲的商業收入。
但這其中的商業邏輯很難論證,這也是開源長期以來面臨的問題,國內外都如此——Meta花了數十億美元訓練Llama卻免費開放,外界至今爭論這筆賬究竟怎麼算,也從來無法體現在Meta財報當中。
而儘管在開源依舊維持着優秀的口碑,但在閉源旗艦模型一側,阿里在2025年發布的Qwen 3、Qwen-3.5系列,儘管維持在第一梯隊,但已有喫力之勢。
林俊暘等核心成員離開,很大程度是源於阿里巴巴當前AI戰略的快速變化,和基礎模型團隊的目標產生了差距。
追趕旗艦模型、維持開源領先地位都很重要,但阿里巴巴的基礎模型團隊訓練資源相對有限。
自2023年以來,Qwen家族累計開源了超過400個模型,模型家族涵蓋了從0.5B到235B的多個參數規模。很難想象,支撐這些模型更新主力的Qwen團隊,僅有100多人。算上通義實驗室其他團隊,整體為數百人規模。
作為對比,字節負責基模訓練的Seed團隊就已經近2000人。在各個方向上,阿里投入的絕對人數,是友商的幾分之一。數位Qwen人士曾對36氪表示,Qwen的算力、Infra建設缺乏資源和支持,這部分阻礙了模型的迭代速度。
這是如今阿里AI戰略急行軍的一個激烈切面。2025年11月,千問App上線,大打春節大戰,可能只是啱啱拉開AI To C戰爭的序幕——字節旗下的豆包已然接近2億日活大關,還有尚未完全發力的騰訊;同時,阿里在旗艦模型也不能掉隊——這關係着阿里雲的商業化閉環,以及整個阿里集團的未來。
(智能湧現作者周鑫雨對本文亦有貢獻。)