機器之心原創
作者:張倩
中興通訊,這家數萬人的科技大廠,憑藉40年 ICT 技術積累正式進軍 AI 賽道。
一家信息通信公司,居然拿到了 AI 推理競賽的冠軍,這事兒有點意思。
前段時間,中文大模型測評基準 SuperCLUE 發佈了 2025 年 5 月報告。這份報告評估了來自 OpenAI、谷歌、DeepSeek、字節跳動等多家國內外 AI 公司的大模型,併發布了多個榜單。報告顯示,雖然海外模型在綜合能力上佔優,但國內模型在推理任務中表現亮眼,Doubao-1.5-thinking-pro-250415 與星雲大模型NebulaCoder-V6 以推理總分 67.4 並列第一。
SuperCLUE 推理榜單深度聚焦模型的邏輯思維與問題解決能力,涵蓋數學推理、科學推理、代碼生成三大硬核維度。
作爲專業賽道的選手,Doubao 的表現並不讓人意外。但是,星雲大模型 NebulaCoder-V6 着實算得上一匹黑馬,因爲它來自一家老牌信息通信公司 —— 中興通訊。而且,除了拿下推理榜單第一,它在綜合總榜中也表現不俗 —— 與 DeepSeek-R1 並列第二,拿到了銀牌。
這樣的成績讓外界對中興這家公司產生了好奇 —— 畢竟在大多數人的認知裏,大模型競賽是互聯網公司和 AI 實驗室、創業公司的主場(上榜的模型也大多出自這類機構)。一個常年和基站、交換機打交道的 ICT 廠商,突然在需要抽象思維和邏輯鏈條的 AI 推理任務中拔得頭籌,確實帶來了意料之外的“跨界”驚喜。
那麼,中興爲什麼要這麼做?爲什麼可以做那麼好?爲了弄清楚這些問題,機器之心和中興通訊的首席戰略與生態專家屠嘉順、星雲大模型總工程師韓炳濤、研究員吳琦聊了聊,瞭解到了通訊與 AI 行業的緊密聯繫以及星雲大模型背後的核心技術,也對中興這家成立 40 年的科技公司的下一站有了新的認識。
中興通訊,爲何重倉押注 AI?
在今年 3 月份的 GTC 大會上,英偉達 CEO 黃仁勳曾預言說,“AI 可以徹底改變通信”。
屠嘉順告訴我們,其實這種改變現在就在發生。以基站爲例,現在的 4G、5G 基站相比前幾年增加了很多,但運維人員數量的增幅卻沒有那麼大。這背後的核心原因是,現在的通信網絡大量採用自動化技術,形成了所謂的“自治網絡”,大大減少了對運維人員的需求。
在即將到來的 6G 時代,這種變革會更加明顯。英偉達高級副總裁 Ronnie Vasishta 在一次簡報會上提到,“6G 的倒計時已經開始。基礎研究已經將注意力轉向下一代無線通信。下一代網絡將是 AI 原生的 ——AI 將嵌入硬件和軟件中…… 下一代無線網絡需要連接數千億臺智能設備,這將需要 AI 的支持”。
屠嘉順同意這種“6G 將是 AI 原生”的說法。他認爲,6G 網絡會從設計之初就將 AI 作爲其核心組成部分,AI 將貫穿於網絡的架構、協議、功能等各個方面。
正是因爲看到了這一顛覆性趨勢的可能性,中興很早就在 AI 方向做前瞻性佈局。在內部,他們成立了多個 AI 相關團隊以及星雲大語言模型、電信行業大模型這樣的大型基礎研究團隊,並把智算等 AI 相關的方向作爲重要的戰略方向,涵蓋 AI 基礎設施、AI 數據中心、上層行業應用智能體等多個方面。前段時間,他們開發的 Co-Sight 智能體還登上了 GAIA 基準測試的榜首。
其實,除了爲未來做準備,當前的中興也已經與 AI 深度綁定。無論是網絡側、算力側還是終端側,中興都有相關的業務佈局。這些業務都需要進行 AI 技術迭代。
而且作爲一家科技公司,中興內部也有用 AI 提高研發效率的需求,比如代碼自動化。他們研發的星雲大模型在其中發揮了重要作用。目前,在內部應用中,星雲大模型每天產生 15 億 token,合成的代碼量已經達到幾千萬行,公司的 AI 代碼佔比已經達到了 30%。
從這些維度來看,中興早已突破大衆對 ICT 廠商的固有認知,實質上是以 AI 爲核心引擎的科技企業,其發展軌跡正朝着 AI 領域加速演進。
星雲大模型,何以奪冠?
此次星雲大模型在 SuperCLUE 推理榜單奪冠,離不開技術團隊設計的大模型高效訓練優化方案。從預訓練到監督微調再到強化學習,他們試圖在每一步都激發出模型極致的推理能力。
預訓練:高效構建知識圖譜,幫大模型打好基礎
預訓練階段的核心目標是提升模型的平均表現,類似於人類學生時代的通識教育。
在這一階段,數據非常重要。但是原始的預訓練數據存在的知識缺失和知識錯誤的問題,是模型產生知識類幻覺的重要原因。
針對這些問題,研究人員設計出了一套高效的知識圖譜構建方法,幫助大模型迅速形成準確度極高的知識結構。
具體來說,他們提出了一個名叫領域共享屬性和自校驗的圖譜知識注入框架 “DASER”(Domain-Aware Self-validating Entity Representation),該框架能夠準確識別預訓練文本中的缺失知識和錯誤知識,再利用搜索引擎從互聯網在線檢索,補全缺失和更正錯誤知識,提升模型的知識性能力,讓模型“看得多”,又“學得準”,更“懂得深”。
什麼叫“領域共享屬性”?研究人員舉了個例子,假如在現成的預訓練語料中,火星的知識非常豐富,但木星的數據殘缺不全,用傳統的預訓練數據直接訓練必然會缺失大量的木星知識,從而導致模型幻覺。DASER 的創新之處在於使用了同一領域內知識的共享規律 —— 比如行星都具有公轉週期、自轉週期等共同屬性。因此在構建木星知識圖譜時,它會根據之前所識別到的行星公共屬性去自動填充可複用的屬性,並通過網絡檢索進行缺失數據填充。
藉助這一方法,星雲大模型團隊構建了覆蓋國家基礎學科分類體系的全學科知識圖譜。模型訓練效率、推理準確性均顯著提升,在中興構建的高難度私域知識類 QA Bench 上,準確率指標由 61.93% 增長至 66.48%。
監督微調:批判學習 + 數據飛輪,讓模型理解複雜指令
監督微調(SFT)階段的目的是將預訓練模型擁有的通用潛力轉化爲特定領域的專業能力,讓模型理解並執行復雜指令,這個過程類似於人類的高等教育或職業培訓。
研究人員介紹說,這一階段的數據通常有兩類:第一類是標準的 QA“問題 - 正確答案”對,用於直接訓練模型模仿正確響應;第二類是思維鏈數據,即在答案中顯式包含推理步驟,引導模型分步解決問題。
更進一步,還可以使用批判學習(Critique Learning, CL)基於難樣本生成特定形式的思維鏈數據,讓模型對錯誤答案進行批判並驗證,從而構建一個持續優化模型推理與批判能力的“批判 - 推理”數據飛輪。
在訓練模型的過程中,他們發現批判學習數據效果更爲顯著。其原理在於:模型如同人腦,對“異常”(如錯誤答案)高度敏感。發現錯誤並提出批判的過程,比單純接受標準答案更能深化模型的理解。
因此,研究人員在 SFT 中引入了批判學習(CL)及成對批判學習(PCL)算法。PCL 的關鍵流程是:
針對困難樣本,模型給出初始(錯誤)回答。
模型對錯誤回答進行批判。
基於批判信息,模型生成修正後的回答。
利用規則方法驗證最終答案的正確性。
上述流程將產生 {任務描述,錯誤回答,批判信息,正確回答} 的四元組訓練樣本。進一步的,他們發現在模型訓練中使用從四元組中抽取 {任務描述,錯誤回答,批判信息} 三元組,而非直接使用四元組,訓練效果會更好。
相較於使用純思維鏈類數據的 SFT,引入額外 CL/PCL 數據的批判 CFT(Critique Fine-Turing)方法在數學、代碼等多項推理中準確率明顯上升。
除此之外,爲了讓模型在遇到用戶複雜指令時也能準確理解並執行。需要讓模型看到更多高質量指令數據。爲了得到這些數據,他們構造了一個數據飛輪。如下圖所示,整個飛輪分爲四個模塊,其中很多工作可以藉助模型來自動完成,比如場景挖掘、候選答案生成。在其中一個關鍵模塊 —— 模型校驗中,他們也用到了批判學習。他們藉助這種方式獲得的數據反哺訓練集,迭代地幫模型提高意圖理解能力。
強化學習:雙階段強化學習,提升回答精度與嚴謹度
強化學習階段的目的是通過環境反饋(獎勵信號)進一步優化模型的行爲策略,使其能夠解決更復雜的現實世界問題,類似於人類的職場實戰。
在這一階段,星雲大模型團隊主要關心兩個問題:如何提高大模型解決複雜問題的準確率和邏輯嚴謹性。
爲此,他們提出了雙階段強化學習,即“先整體糾錯→再局部精修”。
在糾錯階段,他們引入了“批判性強化學習(CRL)”,選取 STEM 領域的高難度問題進行專項訓練,迭代提升模型回答高難度問題的準確度。
在精修階段,研究人員發現使用強化學習會導致回答多樣性下降。拿代碼生成舉例,模型可能有多種正確的實現方式, 如果某一種方式因爲細微的錯誤被視爲負樣本,模型可能會“誤以爲”這種方法本身是錯誤的,從而在未來避免使用。這會導致模型生成的答案多樣性下降,甚至在海量強化數據優化後無法提供解決方案,從能力“湧現”到能力“崩塌”。
爲了解決這個問題,他們首先在數據層面,將模型回答錯誤的樣本,通過一個離線的拒絕採樣過程,獲取“最小修改”糾錯樣本。再改進傳統強化學習算法,單獨計算每個 Token 的回報值。這種“更細粒度”的強化學習算法,使模型無論是模型回答還是思維鏈條都更合理,幻覺明顯下降,人類偏好打分提升 13%。
從 ICT 到 AI 的無縫切換
當 40 年的 ICT 巨頭闖入 AI 戰場,等待他們的是“跨界”陣痛,還是無縫切換?答案可能是後者。
這是因爲,AI 和 ICT 看似“跨界”,實際有很多相似之處,比如它們的核心都在於數據的處理、交換和存儲;都是複雜超大系統的高效協同。
具體來說,ICT 涉及多個網元組成的龐大網絡,AI 需要芯片、服務器、存儲、交換和數據中心組成高效綠色的基座。這些系統不僅需要達到局部最優,還要放在一起進行全局優化。這要求具備全棧的技術積累、工程實踐和系統優化能力,而這恰恰是中興所擅長的,也是他們在未來重要的戰略方向 ——“智算”中所要強化的。
除此之外,在 AI 這個方向上,中興也有自己獨特的優勢。
我們知道,AI 的發展是一個跨多學科的複雜工程科學,它的創新進程離不開大量工程實踐經驗,比如參數調優、算子融合、算法優化…… 其涉及領域之廣,技術門檻之高已經讓一些早期入局的企業感覺喫力。
而從中興身上,我們能夠看到一些走 AI 長期路線的潛質。具體來說,和芯片廠家相比,他們有整體的系統工程能力;和做通算的純 IT 類廠家相比,他們的組網能力更強;和純做大模型的廠家相比,他們的硬件能力又更強。所以綜合來看,中興其實更容易拉起整個產業鏈,無論是硬件開發、軟件平臺、大模型還是行業應用,他們在原來的領域都已經有所涉及。
而且,中興也有巨大的產品生態支撐,這些產品目前正在“AI 化”。如果未來全部 AI 化,市場空間巨大,也能讓技術在豐富的場景中快速迭代,形成數據反哺。
當傳統 ICT 巨頭全力擁抱 AI,這場轉型會給行業帶來怎樣的化學反應?答案或許就在中興接下來的每一步裏。