3月4日凌晨,阿里Qwen技術負責人林俊暘在社交平台上與千問道別,稱「我退出了」。隨後,阿里巴巴通義實驗室科學家惠彬原(Binyuan Hui)轉發該條博文並表示自己也退出了千問。南都N視頻記者就此向阿里雲方面求證,截至發稿尚無回覆。
林俊暘在社交平台上與千問道別。
惠彬原稱自己也退出了。
林俊暘系阿里千問模型的重要負責人。公開資料顯示,林俊暘1993年出生,畢業於北京大學,系阿里巴巴達摩院高級算法專家、阿里通義千問系列大模型技術負責人,主導開發了全球領先的開源大模型。他的研究領域包括自然語言處理和多模態表示學習,研究興趣集中於大規模語言模型和多模態大模型,曾在多個頂級會議發表多篇論文。公開信息顯示 ,林俊暘對通義千問的技術貢獻突出,如他主導開發Qwen3.0等模型性能超越Llama2-70B、首創多模態Agent框架,增強視覺/語音理解能力、推動構建中文社區最大開源模型生態體系等。
有業內人士猜測,林俊暘的離開或由於其考覈目標變成了日活躍用戶數。對於林俊暘離開後誰會接任其位置,該業內人士也提到或是一位來自谷歌Gemini團隊、以日活躍用戶數(DAU)指標為導向的非核心人才。南都記者就此向阿里雲方面求證,截至發稿尚無回覆。
林俊暘與月之暗面創始人兼CEO楊植麟、騰訊首席AI科學家姚順雨和清華大學教授、智譜創始人兼首席科學家唐傑被在業內並稱「基模四傑」,其他幾位均為月之暗面、騰訊、智譜等企業的模型掌門人。今年1月在中關村,林俊暘還提到,自己2021年做模型的時候,阿里芯片團隊的人來問自己三年後模型主流架構是不是Transformer和多模態,因為三年後模型才能流片。他表示,「三年之後,我在不在阿里巴巴,我都不知道。但最後我今天還在阿里巴巴,然後他果然還是Transformer,還是多模態,我就非常懊悔為什麼當時沒有去催他去做。」
模型進展方面,3月3日,阿里巴巴再度開源4款小尺寸千問3.5系列模型。其中最小的0.8B和2B兩款,體積極小,推理速度極快,適合移動設備、IoT 邊緣設備部署,以及低延時的實時交互場景。據悉,四款Qwen3.5新模型雖是小尺寸,但均擁有原生多模態能力,以極小的參數量實現了極大的性能提升。模型發布後還迅速引來馬斯克在社交媒體上讚好評論,稱阿里千問模型「智能密度令人印象深刻」。
(文章來源:南方都市報)