通义巨震:周靖人收权,林俊旸放手?

蓝鲸财经
Mar 09

文|象先志

林俊旸宣布离开千问,这个事非常突然,本来还在看几位长老陪马老师溜园的新闻。

目前确定的信息是,林俊旸是昨天下午提的离职,阿里那边刚开始走流程。同一天,Qwen的后训练负责人郁博文也正式离职,他的工作由年初从谷歌挖过来的zhou姓高管接任。

林俊旸去年刚晋升,是阿里最年轻的P10,外界担心他突然离开给Qwen后续模型研发和更新带来不确定性。

这种担心不太必要。

林俊旸和郁博文等固然是Qwen系列模型的核心功臣,大模型领域单兵能力的重要性也确实相比过去大幅提升,但阿里整个AI研发体系不可能只依赖于两三个重要的技术骨干。

我不相信Qwen因为林俊旸离开就会彻底陨落,就像我不太相信鹅厂招来姚顺雨就能扭转局面一样。

1

先梳理下林俊旸和郁博文等人离开的原因。

有传言是说,阿里内部对现有的开源模式有分歧,觉得开源的成本投入不划算,或者认为开源影响了阿里云卖自己的API。

这个说法不合理。我倒不是说阿里内部没有这种讨论,而是因为林俊旸是做模型基础研发,模型开源还是闭源,都不影响他工作结果的价值。就算阿里突然全面转向闭源,模型研发照样得有人带,后训练这些照样得继续做。

按照这个逻辑,唯一能把这两件事统一起来的,就是林俊旸确实有不可妥协的开源理想。给个P10又怎样,只要Qwen转向闭源,劳资立马撂挑子不干。

这种可能性有,但确实很小。不只是林俊旸走了,郁博文这些也走了,不可能说这些人都要当Richard Stallman吧。

而且综合各方面的消息,林俊旸的离开比较突然。

说是昨天下午通义开了场内部会议,会上产生分歧,林俊旸当场离开,几小时后就在X平台上宣布了离职的消息。林俊旸级别高,阿里如果真的想调整开源战略,这种业务负责人多少有点提前的吹风和讨论。

所以林俊旸突然离开,最大可能还是跟通义最近的组织调整有关。

而这个组织调整的原因,应该不是直接出于开源和闭源的战略有重大变化。今天阿里算是全球模型开源的扛把子,

HF上下载量一直保持领先。但阿里开源的整体状态是三角形:中腰部模型能力很强,但参数量最大的最强模型表现是有差距的。

阿里如果只是想做B端,通过云服务卖API,这个问题还没有那么关键,因为开源跟闭源是两个赛道。然而阿里从去年11月开始,已经明牌要参与这轮AI入口争夺。

因为千问APP起步晚了对手一年多,需要投入更多资源追上对手,整个春节档阿里为千问投入的预算也是最多的。这些措施取得了明显效果,千问APP用户快速增长,目前已经甩开元宝,但仍然低于豆包。

从纯B端向B/C两端兼顾的转向,对Qwen的模型能力提出了更高的要求。集团层面,Qwen也得更多配合千问APP的产品团队,因为后者当下是集团最大的优先级。

林俊旸直接负责的Qwen团队隶属于通义实验室,后者由阿里云CTO周靖人负责。

通义正计划将Qwen团队分拆,从涵盖不同训练流程和模态的 “垂直整合” 体系,转变成预训练、后训练、文本、多模态等一个个分开的水平分工团队,这些团队仍隶属通义实验室。

晚点报道提到,林俊旸并不认可这种分开拆散团队的做法,他认为预训练、后训练,乃至 Infra 和训练团队应该更紧密地结合和沟通。

这个描述其实非常有意思,值得推敲一番。

预训练、后训练这些团队本身就是各自存在的,为什么在Qwen下面就是垂直整合,分拆过后就是水平分工呢?整个通义实验室依旧在周靖人博士的领导之下,各团队之间的拉通对齐怎么就不能做继续做呢?

按照互联网公司喜欢讲的管理学模型,甚至可以说这让组织结构进一步扁平化,有利于提高信息传递的效率。

当然这只是理论上,而理论跟实际往往有相当的距离。林俊旸和Qwen团队已经经过了长时期磨合,保持着高强度产出,做这种分拆一定意味着大量的组织摩擦和不确定性。

2

这些动作无法避免的后果是,林俊旸的“势力范围”在缩减。

他领导的Qwen团队从去年中开始组建自己的Infra团队,代替原来阿里云的人工智能平台PAI。也就是说,Qwen团队在逐步补齐所有LLM训练需要的基础设施。

OpenAI infra负责人翁家翌前段时间提到,真正拉开openai和meta差距的就在于infra上。他认为这其中的关键在于谁的RL infa BUG相对更少,训练迭代更快。

所以可以推测,林俊旸对于由阿里云PAI来负责通义各业务的infra不满意,因此要单独组建infra团队。

但阿里内部对Qwen团队的投入产生评价本身就是有分歧的,这种团队扩充或许进一步加剧了这种分歧,拉大了集团高管跟林俊旸团队的张力。据说甚至有高管对除夕夜亮相发布的 Qwen-3.5 并不完全满意,称其是一个 “半成品”。

最终的局面就变成,一边是林俊旸和Qwen团队感觉受到了集团的资源掣肘,另一边则是集团对Qwen表现也不满意,要大调组织架构,提升产出并且加强跟C端产品的闭环。

今天还流出一份吴妈给通义团队开会的摘要,信息量很多但不保真。

看起来从谷歌挖过来的zhou姓高管,是林俊旸离职的导火索。zhou担心自己融不进Qwen团队,所以要求挂到周靖人下面。晚点报道也提到,zhou确实是直接向周靖人汇报。

这个细节如果属实,那基本意味着zhou跟林早就是要二选一。

因为zhou是搞后训练的,搞后训练的跟统筹模型研发的不对付,还向顶头上司“告御状”,暗示对方要排挤我,这后面抬头不见低头见的,哪里还有合作的可能。

既然最后zhou的诉求得到了满足,成功入职了,就说明周靖人和集团当时已经在两个人之间做出了选择。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10