周靖人成為阿里合夥人,通義實驗室持續調整應對激烈競爭

市場資訊
12/10

  來源:晚點LatePost

  阿里培養的校招生正在成為通義實驗室研發主力。

  陳佳惠

  編輯賀乾明 管藝雯

  我們獨家獲悉,阿里雲 CTO、通義實驗室負責人周靖人近期成為阿里巴巴合夥人。

  合夥人團隊是阿里的最高集體決策機構。今年 6 月,阿里合夥人團隊剛經歷大幅縮編,人數降至上市以來最低的 17 人。

  阿里選拔合夥人,候選人除了在阿里工作 5 年以上、高度認同公司文化、對公司發展有積極貢獻、願意為公司文化和使命傳承竭盡全力,還需要四分之三以上的合夥人讚同才能當選,也就是 17 位合夥人需要至少 13 人投讚成票。

  周靖人已經在阿里工作十年。他畢業於中國科技大學,2004 年獲得美國哥倫比亞大學計算機博士學位,後加入微軟擔任研發合夥人。2015 年,他加入阿里出任阿里雲首席科學家,之後轉崗多次:剛開始在阿里雲負責 iDST(數據科學與技術研究院,達摩院前身),隨後負責電商的搜索推薦廣告,2020 年底轉去螞蟻,一年多之後回到阿里雲擔任 CTO、兼達摩院副院長。

  我們瞭解到,周靖人成為阿里合夥人的關鍵因素之一,是他負責的通義實驗室過去一年努力保證了 Qwen 的模型領先地位。阿里管理層給了他高度肯定,評價 「這非常不容易」。

  從達摩院到通義實驗室,阿里重組研究組織

  2023 年大模型浪潮到來時,阿里正在推進 1+6+N 變革。達摩院作為 「N」,要從阿里雲體系分拆出去。在這個過程中,達摩院多個 AI 研發團隊重組成通義實驗室,隸屬於阿里雲,由周靖人負責。

  同年,吳泳銘正式接任阿里巴巴 CEO,併兼任阿里雲董事長、CEO。上任不久,他在內部信中提出把管理團隊變得年輕。

  這種傾向在通義實驗室有直接體現。2020 年,達摩院有兩個團隊同時研發大語言模型,分別是黃非負責的 AliceMind 和周暢、林俊暘等人參與的 M6 項目。到 2022 年,阿里把大模型技術路線收斂到 M6 上,改名為 Qwen 系列。

  通義實驗室成立後,基礎語言模型千問研發團隊由 1990 年出生的周暢負責。他 2017 年博士畢業於北京大學,以校招生身份加入阿里。資歷更深的黃非團隊,主要負責大模型應用算法,比如通義靈碼(編程模型)、通義星塵(角色扮演模型)。

  類似的情況也出現在視覺模型研究方向。除了薄列峯負責的應用視覺團隊,通義實驗室還組建了圖像、視頻生成模型研發的萬相團隊,由 2015 年清華碩士畢業後,同樣以校招生身份加入阿里的劉宇負責。

  經過一年追趕,阿里開源的 Qwen 系列大模型在全球開源模型中存在感持續提升。2024 年 10 月,其衍生模型數量達到 8 萬多個,超過更早開源的  Meta Llama 系列。

  在通義實驗室組建年輕組織過程中,也出現人才變動。2024 年 7 月,千問模型研發團隊負責人周暢離職,之後加入字節 Seed 團隊。

  我們瞭解到,千問模型團隊中超 80% 為阿里自主培養的校招生。他們在阿里體系內的薪酬線性增長,趕不上字節和大模型創業公司為了爭搶人才給出的溢價。

  周暢離職後,其負責的千問模型研發團隊由更年輕的林俊暘負責。林俊暘 2019 年從北京大學碩士畢業,也以校招生身份加入阿里,現在是阿里最年輕的 P10。同時,阿里給千問大模型研發團隊成員都提高一個職級,薪水同步上漲。

  「我們一直有激勵團隊。薪酬匹配是需要的,但高薪不是唯一手段。」 周靖人曾接受我們訪談說。

  今年,從達摩院併入通義實驗室的多位技術負責人陸續離場。

  我們獨家瞭解到,阿里通義實驗室自然語言處理方向負責人黃非於近期離職。黃非本科畢業於天津大學,2005 年從卡耐基梅隆大學博士畢業,先在 IBM Watson 從事 NLP 相關研究,後加入 Facebook,擔任 AI 翻譯團隊主管。

  2018 年,黃非加入成立不久的阿里達摩院,把機器翻譯等技術應用到阿里集團各個業務中,並帶隊研發了阿里早期的大語言模型之一 AliceMind。2023 年,黃非團隊併入通義實驗室。

  黃非離職後,他帶的團隊中幾位負責人直接向阿里雲 CTO、通義實驗室負責人周靖人彙報。除了黃非,今年從通義實驗室離開的技術研發負責人還有 2 位:

  鄢志傑,通義實驗室語音團隊負責人。他 2015 年加入阿里達摩院前身 iDST。今年 2 月離職,之後加入騰訊,又從騰訊離職加入京東

  薄列峯,通義實驗室應用視覺團隊負責人。他 2022 年 9 月加入阿里達摩院,擔任達摩院 XR 實驗室負責人,今年 4 月底離職,之後加入騰訊。

  更激烈的競爭、更高的期待,讓研究團隊靠自驅力工作

  我們曾報道,通義實驗室今年有三個最重要的工作目標:一是守住模型排名的領先位置,模型性能、下載量、衍生模型數量都領先;二是要滲透更多商業應用場景;三是 2025 年,整個通義模型的日均調用量目標做到數十倍的增長。

  同樣採用開源策略的 DeepSeek 走紅後,智譜、月之暗面、MiniMax、階躍星辰等中國大模型創業公司普遍開源參與競爭,給通義實驗室帶來更大壓力。

  同時,通義實驗室和千問 app 在阿里體系內揹負了更大的期待。今年 11 月,阿里智能信息事業羣推出新款千問 app,明確對標 ChatGPT。千問應用相關的人士稱,這是繼 AI 基建、淘寶閃購後,阿里今年宣佈的又一個集團戰略項目。

  12 月 9 日,阿里把智能信息與智能互聯兩個事業羣重組為千問 C 端事業羣,由阿里副總裁吳嘉負責,首要目標是 「將千問打造成為一款超級 app,成為 AI 時代用戶的第一入口」。

  據我們瞭解,千問 app 目前以天為單位進行功能更新,幾百名工程師聚集在阿里巴巴西溪園區 C4 樓封閉開發,正在加速接入阿里體系內淘寶、高德等應用,預計在春節前會有一次大迭代。

  千問 app 重要程度提升,需要通義實驗室持續提供能力強大的底層模型。周靖人今年 4 月說,他與吳嘉討論很頻繁,通義的重要目標之一是支持好這些產品,「也能給我們模型研發一些反饋。」

  通義實驗室高層並沒有因此給研究人員施加更大的壓力,希望他們靠自驅力工作。

  「靖人不怎麼管我們。」 一位通義實驗室人士說。但他們都給自己定了較高的目標,比如林俊暘要讓 Qwen 模型對標 Gemini,在國際上的影響力更進一步。

  寬鬆的管理風格也讓他們積極探索更多研究方向,比如千問模型團隊今年新組建具身智能小組。同時千問模型研發團隊也有小組在研究語音、文生圖等模型,而通義實驗室已經有其他團隊在研究類似模型。

  通義實驗室今年也至少從外部引入兩位技術負責人。一位是曾在百度、滴滴負責語音識別,後來加入零一萬物的李先剛。他接替鄢志傑負責通義實驗室語音團隊。

  另一位是今年 2 月加入阿里智能信息事業羣的許主洪。他曾是新加坡管理大學信息系統學院教授、Salesforce 亞太區研究總監。今年 9 月,他轉崗到通義實驗室,負責多模態大模型的研發。

  伴隨多位技術管理者的更迭,通義實驗室完成新一輪的核心人才盤整。在這個節點,周靖人入選合夥人,是阿里在組織層面深入持續推進 AI 戰略的直接體現:給予更多信任與資源的同時,也需要他在充滿不確定性的外部競爭中,帶隊拿到更確定的結果。

海量資訊、精準解讀,盡在新浪財經APP

責任編輯:何俊熹

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10