
摘要:
這些清華學子不僅握有核心資源,也幫助中國大模型在全球市場取得了顯著的影響力。
鳳凰網科技 出品
作者|趙子坤、董雨晴
編輯|董雨晴
2025年,是清華當之無愧的收穫年。鳳凰網科技不完全統計,目前各大互聯網公司、頭部大模型創業公司的掌舵者,已多數出自清華,如智譜創始人唐傑、CEO張鵬,月之暗面Kimi創始人兼CEO楊植麟,騰訊CEO/總裁辦公室首席AI科學家姚順雨,他們中智譜啱啱拿下「全球大模型第一股」,Kimi也順利超額完成C輪孖展,27歲的姚順雨以高光掌舵騰訊核心模型研究任務。

可以說,這些清華學子不僅握有核心資源,在全球市場都具有顯著的影響力,都是AGI決賽圈的中國種子選手。
1月10日,鳳凰網科技現場參與了由清華大學基礎模型北京市重點實驗室低調發起的一場名為AGI-Next的前沿峯會,與會人物除了前述提及的三人,還包括Qwen技術負責人林俊暘。他們要探討的,正是邁向AGI下一階段的關鍵路徑。
在他們身後,是中國開源大模型力量在全球舞台上的集體崛起。

三個清華學霸頂峯再相見
今天之所以會有這場觀點交鋒,故事可以追溯到2006年,在獲得清華大學計算機科學與技術專業工學博士學位後,唐傑拒絕了諸多大公司伸出的橄欖枝,放棄高薪職位,選擇留在清華大學擔任老師。
他自小喜歡編程,高中時期物理成績就非常優秀。2006年,在加入清華後,便投身到了KEG(清華大學計算機系知識工程實驗室)。當時,谷歌在學術界碩果累累,唐傑覺得國內缺少一個同等能量的學術引擎,這一年,他和同門師兄弟,開始了AMiner系統的搭建。這是一個彙集了衆多研究者檔案的平台,當時便為阿里和騰訊等大公司提報了不少線索支持。
一直到2010年,AMiner的系統用戶已覆蓋180個國家,平台創造了3年52萬獨立IP訪問記錄。研究成果還在與IBM、Google、Nokia、搜狐的多個國際合作和企業合作項目中得到推廣應用。
這個清華園的技術成果最終轉化為了智譜的前身,2019年,在中科創星的早期孵化下,瞄準自然語言處理與知識圖譜,智譜華章正式誕生。現如今的智譜CEO張鵬,同樣畢業於清華大學,並在2005年加入了清華大學知識工程實驗室。
早在OpenAI發布GPT1時,中科創星就敏銳預判到,自然語言處理、知識圖譜是機器視覺(CV)之後,AI行業最重要的技術發展方向。
這個早期觀點,一直到2021年,GPT3發布才成為行業共識。即便如此,由於當時國內早期主打CV視覺的AI四小龍頻頻碰壁,使得國內AI賽道正在經歷慘淡的低谷期,沒有人在其上押注。
2023年前五個月,後來成為中國大模型起跑的關鍵月份,期間月之暗面Kimi、百川智能、階躍星辰、零一萬物中國大模型六虎終於全數成立完成,掌舵者半數來自清華。2023年7月,梁文鋒帶領的幻方量化做了一個重要決定,自己下場展開大語言模型研究,此後DeepSeek誕生。
只用了一年半時間,就扭轉了全球的競爭賽點,在這種架構創新的氛圍下,今天高峯論壇裏的各方力量貢獻着自己的創新觀點。
姚順雨對模型分化的看法,是AI應用正沿着To B與To C兩條路徑分化。在消費端,ChatGPT類產品對普通用戶更像是「搜索引擎增強版」,體驗迭代感知不強;而在企業端,「智能即生產力」的邏輯讓客戶願為最強模型支付高溢價。「強的模型和弱的模型分化會越來越明顯。」

「分化是自然的分化,我更願意相信AGI,做AGI該做的事情,順其自然。」阿里千問大模型技術負責人林俊暘則從市場差異切入,指出一個被忽略的事實:在中國,Coding消耗量沒有那麼大,而美國市場則「基本上全都是Coding」。
在最受關注的「中美競爭」議題上,觀點出現微妙分野。
姚順雨展現樂觀,認為中國在技術復現和工程優化上優勢明顯。關鍵突破點在於算力自主(光刻機)、To B市場成熟度,以及最重要的——「更多有冒險精神的人去引領範式突破」。
提及中美的研究文化之差異時,姚順雨說,「在中國,大家更喜歡做更安全的事情。只要這件事情一旦被證明能做出來,我們都很有信心,幾個月或者一段時間內就把這個問題搞清楚,但如果這個事情大家不知道怎麼做、不知道能不能做起來,還是比較困難的。可能不只是更喜歡做確定性的事情、不太願意做創新性的事情,很重要的一點是文化的積累或者整體的認知。」
他還提及,中國對刷榜或者數字看得更重一點。「DeepSeek比較好的一點,是沒有那麼關注排行榜的數字,可能會更注重,第一,什麼是正確的事情;第二,什麼是你自己能體驗出好或者不好的……還是需要大家能夠走出這些排行榜的束縛,能夠堅持自己覺得是不是正確的過程。」
面對「三五年後,最領先的那個公司,是一家中國公司的概率」的假設,林俊暘則給出20%的謹慎預估。他觀察到核心差異,「美國的Computer可能整體比我們大1-2個數量級」,美國將更多算力投入前沿研究,中國算力則被交付需求佔據。
「創新是發生在有錢人手裏還是窮人手裏?我們雖然是一羣窮人,是不是窮則生變,創新的機會會不會發生在這裏?」林俊暘說。
唐傑則從代際視角提供新解:「90後、00後這一代企業,遠遠好過之前。」他強調,中國機會在於敢冒險的聰明人、改善的創新環境,以及「笨笨的堅持」。

四位推動中國大模型開源革命的關鍵人物落座
2015年,姚順雨以安徽省理科第三的成績考入清華姚班。2018年,按姚班傳統赴麻省理工學院交流,系統性切入AI研究。2019年,他進入普林斯頓大學,將主攻方向從計算機視覺轉為更具通用潛力的自然語言處理與強化學習,並最終以智能體研究聞名。在當時,這就是一種「乖學生」的按部就班。
2024年8月,姚順雨加入OpenAI擔任研究科學家,是OpenAI首批智能體產品 Operator 和 Deep Research的核心貢獻者,致力於將大模型從理論研究推向實際應用。在《麻省理工科技評論》「35歲以下科技創新35人」入選評語中寫着,姚順雨為語言智能體方向的開啓和發展做出了基礎性貢獻。他提出了 ReAct 方法,首次引入「推理—行動」結合的智能體範式,為創建具備通用性、可擴展性的語言智能體奠定了基礎。
2025年也成為了姚順雨的轉折年,鳳凰網科技在當年9月獲悉,姚順雨規劃回國,並接觸了多家大廠。這個轉折直到2025年12月才揭曉,姚順雨正式加入騰訊並出任首席AI科學家,同時兼任新成立的AI Infra部及大語言模型部負責人,全面負責騰訊大模型研發體系。
姚順雨加入騰訊後的首次公開露面貢獻給了這個重要的場合。席間落座的四位核心人物,各自代表了中國大模型開源革命的不同力量,他們的發展路徑與決策正影響着全球AI格局。
唐傑作為清華大學計算機系教授與智譜的創始人,其職業生涯完美體現了清華系「學術研究-技術轉化」的模式。
其在現場表示,智譜從2019年研究至今,見證了大模型行業的變化,智能水平已大幅提高,從早期簡單問答到如今能處理複雜推理、編程乃至真實世界問題。模型通過知識記憶、推理訓練、強化學習等階段演進,但泛化能力仍需提升。「我們認為當前大模型範式已接近上限,下一步需探索新方向,讓模型具備更強的自主交互與複雜任務解決能力。」
在智譜AI上市當日,唐傑曾發布內部信,宣佈「很快將推出新一代模型GLM-5」,他也明確表示2026年戰略將全面迴歸基礎模型研究,似是為探索超越Transformer的全新模型架構做準備。
頗為巧合的是,2025年末,楊植麟曾宣佈月之暗面完成了5億美元C輪孖展,公司估值達43億美元。他在內部信中毫不掩飾雄心:「接下來公司最重要的目標是超越Anthropic等前沿公司成為世界領先的AGI公司。」
對於下一代K3模型,楊植麟透露將融入重大的架構變革。2025年11月,他在Reddit論壇上表示:「KDA(Kimi Delta Attention,一種線性注意力模塊)是我們最新的實驗性架構,相關想法很可能會在K3中使用。」
這種線性注意力機制有望帶來更長的上下文處理能力,對其社交應用和智能體至關重要。
楊植麟也在此次分享上表示,Kimi的預訓練策略圍繞兩個維度:一是提升數據效率,即用更少數據達到相同效果;二是優化長上下文能力,使模型在更長上下文中損失更低,以支持複雜任務。Kimi採用二階優化器,相比傳統一階優化器,在達到相同效果時可節省約50%的計算量,等價於提升一倍的訓練效率。
在強化學習與模型調優方面,Kimi在多項複雜任務上達到或超越國際先進水平,尤其是在代碼生成與長序列任務上表現突出。模型能夠進行連續多輪工具調用與推理,完成複雜問題求解。
Kimi認為,模型不僅是工具,更是人類認知的延伸,能夠提升文明上限。儘管存在風險,但應繼續推進技術發展,因為放棄開發意味着放棄人類進步的可能。
林俊暘及其領導的阿里通義千問團隊是兵團式作戰,他們早在2023年時訓練千問大模型時,就曾嘗試改很多東西,但最終發現Transformer確實挺好用的。因此,在此後的一年多時間裏,團隊都在圍繞着共識做動作。一直到2025年,千問團隊的注意力轉向了非共識,尋找新的架構創新。
這些敢於從0-1探索的態度,既來源於DeepSeek的創新啓示,也來自於全球化開源戰爭格局的變化。
就在2天前,DeepSeek一口氣將其核心研究論文從原20頁大幅擴展至86頁,詳細披露了R1模型的技術細節與性能提升。證明了不依賴海量標註數據,通過精心設計的純強化學習(RL) 也能讓模型獲得頂尖的推理能力。這為行業提供了一套可復現的「算法驅動」新範式。
此外,在2026年開年第一天,DeepSeek發布了梁文鋒參與署名的文章,即全新的流形約束超連接(mHC)架構,它旨在解決當前大模型(尤其是採用「超連接」擴展後)訓練不穩定、內存開銷大的根本問題。
無論是R1的RL訓練配方,還是mHC的穩定架構,都讓更多研究機構和公司有望在有限算力下探索前沿模型,可能催生更多創新。
DeepSeek將技術細節公開到教科書級別,樹立了開源的新標杆。這種極致透明加速了全球範圍內的技術驗證與迭代,對閉源模型形成了獨特的競爭壓力。
2025年,是毫無疑問的中國開源模型的勝利年。
公開數據顯示,截至2025年8月,阿里通義已開源200餘個模型,全球下載量超3億次,千問系列衍生模型突破10萬個,遠超 Meta的Llama系列,更一躍成為全球最大的開源模型家族。甚至,彭博社曾爆出,Meta最新AI模型「牛油果」項目正在祕密使用中國阿里巴巴的千問Qwen開源模型進行蒸餾訓練。智譜同樣打破了海外模型霸榜的局面,首次殺入top10名單。
站在2026年開局新起點,在中國取得的巨大進展之上,新的範式會不會就此碰撞而來?期待新創新的誕生。
以下是針對本次峯會提煉的現場金句:
主持人拾象科技CEO李廣密
● 「2025年是中國開源模型大放異彩的一年,是開源四傑在全球大放異彩的一年,而且是Coding過去一年有10-20倍增長的一年。」
● 「硅谷幾家明顯做分化……專注到了企業,專注到了Coding,專注到了Agent。我也在想接下來中國的模型會分化成自己想要的哪些方向?」
● 「Agent今天可以在後台推理3-5個小時,做人類1-2天的工作量,大家期待2026年可以做人類正常工作1-2周的工作量……2026年Agent可能是創造經濟價值的關鍵一年。」
姚順雨
● 「Coding誇張一點來講,已經在重塑整個計算機行業做事的方式,人已經不再寫代碼,而是用英語和電腦去交流。」
● 「對於TO B來說,很明顯的一點是,智能越高,代表生產力越高,值錢的也越來越多。」
● 「很多人願意花溢價用最好的模型……強模型和稍微差點,或者弱的模型它的分化會越來越明顯。」
● 「對於To B來說,這個趨勢似乎是相反的,模型在變的越來越強、越來越好,但同樣會有很多應用層的東西應用好的模型在不同的生產力環節。」
● 「這個事情想要變好,不是說你需要更大的模型、更強的預訓練、更強的強化學習、更強的Agent環境或者更強的搜索引擎,這個問題可能需要更多額外的輸入,把額外的輸入用好,反而會給用戶帶來很多額外的價值。」
● 「這個事情已經在發生了,可能效率或者受限制的限制,有各種各樣的問題,它更像是一個漸變,不是突變。」
● 「很多人說2026年看到(自主學習的)信號,我覺得2025年就看到信號了。」
● 「如果2026年或者2027年我們有一個範式的發生……我們應該用什麼樣的任務,它應該是什麼樣的效果,你會相信它實現了?我覺得可能需要先想象到它長什麼樣。」
● 「目前看起來,任何一個事情一旦被發現,在中國就能夠很快的復現,在很多局部做的更好。」
● 「中國想要突破新的範式或者做非常冒險事情的人可能還不夠多……我們到底能不能引領新的範式,這可能是今天中國唯一要解決的問題。」
林俊暘
● 「公司也不一定有那麼多基因之分,一代一代的人可能就塑造了這些公司。比如說今天順雨到騰訊之後,可能騰訊變成一個有着順雨基因的公司。」
● 「我更願意相信AGI,做AGI該做的事情,順其自然。」
● 「今天AI更大的魅力是在長尾……今天所謂的AGI就在解這個問題,你做通用Agent,能不能把長尾的問題給解決,全世界任何一個角落,尋遍各處都找不到,但是你卻能幫我解決,這就是AI最大的魅力。」
● 「大量的技術所謂的突破性都是一些觀測問題,都是在線性發展的,只是人類對它的感受非常強烈而已。」
● 「我們的模型為人類社會帶來了什麼樣的價值,只要我相信我這個東西能夠為人類社會帶來充分的價值,能夠幫助人類,就算不是最強的,我也願意接受。」
● 「我非常擔心安全的問題,不是擔心它今天講一些不該說的話,最擔心的是它做一些不該做的事情……就像培養小孩一樣,我們要給它注入一些正確的方向。」
楊強
● 「工業界可能還沒來得及解決的一些問題,智能上界在哪裏。」
● 「哥德爾不完備定理,大概意思是說一個大模型不能自證清白,必定有一些幻覺不可能消滅掉……多少資源能夠換取多少幻覺的降低或者錯誤率的降低,這是有一個平衡點的。」
● 「Agent應該是由大模型內生的一個native的系統。」
● 「我們可以回顧一下互聯網的發展,一開始也是從美國開始,但中國很快就趕上了,而且應用像微信,是世界第一的。」
唐傑
● 「這一仗從DeepSeek出來之後,已經沒有了,已經結束了。DeepSeek之後我們應該想的是下一仗是什麼東西?」
● 「我們對今年會有非常大的範式革新有信心。」
● 「之前,工業界有1萬片,學校是0片或者1片,倍數是1萬次,但是到現在,很多學校已經有很多卡了。」
● 「最笨的辦法就是Scaling,Scaling我們會有收益,Scaling肯定會帶來智能上界的提升。第二個辦法是應該定義Intelligence efficiency,也就是智能的效率,我們獲得智能的效率,我們用多少投入能獲得這個智能的增量。」
● 「大模型到現在更多的是在拼速度、拼時間,也許我們代碼正確了,就會在這方面走的更遠一點,但也許失敗,半年就沒了。」
● 「我們這一代最不幸運……世界已經交給下一代了,已經把我們這一代無縫跳過了。」
● 「如果我們笨笨地堅持,也許走到最後的就是我們。」