周靖人成为阿里合伙人,通义实验室持续调整应对激烈竞争

市场资讯
Dec 10

  来源:晚点LatePost

  阿里培养的校招生正在成为通义实验室研发主力。

  陈佳惠

  编辑贺乾明 管艺雯

  我们独家获悉,阿里云 CTO、通义实验室负责人周靖人近期成为阿里巴巴合伙人。

  合伙人团队是阿里的最高集体决策机构。今年 6 月,阿里合伙人团队刚经历大幅缩编,人数降至上市以来最低的 17 人。

  阿里选拔合伙人,候选人除了在阿里工作 5 年以上、高度认同公司文化、对公司发展有积极贡献、愿意为公司文化和使命传承竭尽全力,还需要四分之三以上的合伙人赞同才能当选,也就是 17 位合伙人需要至少 13 人投赞成票。

  周靖人已经在阿里工作十年。他毕业于中国科技大学,2004 年获得美国哥伦比亚大学计算机博士学位,后加入微软担任研发合伙人。2015 年,他加入阿里出任阿里云首席科学家,之后转岗多次:刚开始在阿里云负责 iDST(数据科学与技术研究院,达摩院前身),随后负责电商的搜索推荐广告,2020 年底转去蚂蚁,一年多之后回到阿里云担任 CTO、兼达摩院副院长。

  我们了解到,周靖人成为阿里合伙人的关键因素之一,是他负责的通义实验室过去一年努力保证了 Qwen 的模型领先地位。阿里管理层给了他高度肯定,评价 “这非常不容易”。

  从达摩院到通义实验室,阿里重组研究组织

  2023 年大模型浪潮到来时,阿里正在推进 1+6+N 变革。达摩院作为 “N”,要从阿里云体系分拆出去。在这个过程中,达摩院多个 AI 研发团队重组成通义实验室,隶属于阿里云,由周靖人负责。

  同年,吴泳铭正式接任阿里巴巴 CEO,并兼任阿里云董事长、CEO。上任不久,他在内部信中提出把管理团队变得年轻。

  这种倾向在通义实验室有直接体现。2020 年,达摩院有两个团队同时研发大语言模型,分别是黄非负责的 AliceMind 和周畅、林俊旸等人参与的 M6 项目。到 2022 年,阿里把大模型技术路线收敛到 M6 上,改名为 Qwen 系列。

  通义实验室成立后,基础语言模型千问研发团队由 1990 年出生的周畅负责。他 2017 年博士毕业于北京大学,以校招生身份加入阿里。资历更深的黄非团队,主要负责大模型应用算法,比如通义灵码(编程模型)、通义星尘(角色扮演模型)。

  类似的情况也出现在视觉模型研究方向。除了薄列峰负责的应用视觉团队,通义实验室还组建了图像、视频生成模型研发的万相团队,由 2015 年清华硕士毕业后,同样以校招生身份加入阿里的刘宇负责。

  经过一年追赶,阿里开源的 Qwen 系列大模型在全球开源模型中存在感持续提升。2024 年 10 月,其衍生模型数量达到 8 万多个,超过更早开源的  Meta Llama 系列。

  在通义实验室组建年轻组织过程中,也出现人才变动。2024 年 7 月,千问模型研发团队负责人周畅离职,之后加入字节 Seed 团队。

  我们了解到,千问模型团队中超 80% 为阿里自主培养的校招生。他们在阿里体系内的薪酬线性增长,赶不上字节和大模型创业公司为了争抢人才给出的溢价。

  周畅离职后,其负责的千问模型研发团队由更年轻的林俊旸负责。林俊旸 2019 年从北京大学硕士毕业,也以校招生身份加入阿里,现在是阿里最年轻的 P10。同时,阿里给千问大模型研发团队成员都提高一个职级,薪水同步上涨。

  “我们一直有激励团队。薪酬匹配是需要的,但高薪不是唯一手段。” 周靖人曾接受我们访谈说。

  今年,从达摩院并入通义实验室的多位技术负责人陆续离场。

  我们独家了解到,阿里通义实验室自然语言处理方向负责人黄非于近期离职。黄非本科毕业于天津大学,2005 年从卡耐基梅隆大学博士毕业,先在 IBM Watson 从事 NLP 相关研究,后加入 Facebook,担任 AI 翻译团队主管。

  2018 年,黄非加入成立不久的阿里达摩院,把机器翻译等技术应用到阿里集团各个业务中,并带队研发了阿里早期的大语言模型之一 AliceMind。2023 年,黄非团队并入通义实验室。

  黄非离职后,他带的团队中几位负责人直接向阿里云 CTO、通义实验室负责人周靖人汇报。除了黄非,今年从通义实验室离开的技术研发负责人还有 2 位:

  鄢志杰,通义实验室语音团队负责人。他 2015 年加入阿里达摩院前身 iDST。今年 2 月离职,之后加入腾讯,又从腾讯离职加入京东

  薄列峰,通义实验室应用视觉团队负责人。他 2022 年 9 月加入阿里达摩院,担任达摩院 XR 实验室负责人,今年 4 月底离职,之后加入腾讯。

  更激烈的竞争、更高的期待,让研究团队靠自驱力工作

  我们曾报道,通义实验室今年有三个最重要的工作目标:一是守住模型排名的领先位置,模型性能、下载量、衍生模型数量都领先;二是要渗透更多商业应用场景;三是 2025 年,整个通义模型的日均调用量目标做到数十倍的增长。

  同样采用开源策略的 DeepSeek 走红后,智谱、月之暗面、MiniMax、阶跃星辰等中国大模型创业公司普遍开源参与竞争,给通义实验室带来更大压力。

  同时,通义实验室和千问 app 在阿里体系内背负了更大的期待。今年 11 月,阿里智能信息事业群推出新款千问 app,明确对标 ChatGPT。千问应用相关的人士称,这是继 AI 基建、淘宝闪购后,阿里今年宣布的又一个集团战略项目。

  12 月 9 日,阿里把智能信息与智能互联两个事业群重组为千问 C 端事业群,由阿里副总裁吴嘉负责,首要目标是 “将千问打造成为一款超级 app,成为 AI 时代用户的第一入口”。

  据我们了解,千问 app 目前以天为单位进行功能更新,几百名工程师聚集在阿里巴巴西溪园区 C4 楼封闭开发,正在加速接入阿里体系内淘宝、高德等应用,预计在春节前会有一次大迭代。

  千问 app 重要程度提升,需要通义实验室持续提供能力强大的底层模型。周靖人今年 4 月说,他与吴嘉讨论很频繁,通义的重要目标之一是支持好这些产品,“也能给我们模型研发一些反馈。”

  通义实验室高层并没有因此给研究人员施加更大的压力,希望他们靠自驱力工作。

  “靖人不怎么管我们。” 一位通义实验室人士说。但他们都给自己定了较高的目标,比如林俊旸要让 Qwen 模型对标 Gemini,在国际上的影响力更进一步。

  宽松的管理风格也让他们积极探索更多研究方向,比如千问模型团队今年新组建具身智能小组。同时千问模型研发团队也有小组在研究语音、文生图等模型,而通义实验室已经有其他团队在研究类似模型。

  通义实验室今年也至少从外部引入两位技术负责人。一位是曾在百度、滴滴负责语音识别,后来加入零一万物的李先刚。他接替鄢志杰负责通义实验室语音团队。

  另一位是今年 2 月加入阿里智能信息事业群的许主洪。他曾是新加坡管理大学信息系统学院教授、Salesforce 亚太区研究总监。今年 9 月,他转岗到通义实验室,负责多模态大模型的研发。

  伴随多位技术管理者的更迭,通义实验室完成新一轮的核心人才盘整。在这个节点,周靖人入选合伙人,是阿里在组织层面深入持续推进 AI 战略的直接体现:给予更多信任与资源的同时,也需要他在充满不确定性的外部竞争中,带队拿到更确定的结果。

海量资讯、精准解读,尽在新浪财经APP

责任编辑:何俊熹

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10