回望2025年,大語言模型行業取得了一些發展,但同時也面臨着一定的挑戰。DeepSeek憑藉開源策略和推理功能成為黑馬,用戶增長很快。國內外頭部廠商如OpenAI、谷歌、騰訊、阿里巴巴、字節跳動,以及智譜、月之暗面這些專業大模型公司,在技術、應用和生態上持續競爭。
財經專欄作者馬繼鵬接受《中國經營報》記者採訪時表示,目前來看,整個行業還處於朝氣蓬勃發展的一種狀態,很明顯的就是,這些互聯網巨頭研發的這些大語言模型,後勁還是比較足的,比如字節跳動的豆包、阿里巴巴的千問、百度的文心一言、騰訊的元寶。目前來看,各家的水平可能都差不多,但是互聯網巨頭在大模型應用方面,和專門做大模型的公司如Kimi、DeepSeek相比,有一些天然的優勢,其更懂得怎麼大規模地獲取用戶,怎麼解決用戶的實際問題。
2025這一年
綜合2025年多個關鍵時間點的公開信息,騰訊混元大模型在這一年的發展可以概括為年初的技術攻堅與能力突破,到年中生態與應用的全面鋪開,再到年底在「世界模型」上的戰略卡位,體現了從技術追趕到場景落地的清晰路徑。
比如,混元在模型能力升級方面,快慢思考結合,推出TurboS(快思考)與T1(慢思考)組合,增強推理與響應能力。
DeepSeek這一年的發展確實亮眼,從模型架構到應用場景都有不少突破。DeepSeek-V3(2024年12月發布)是當前的開源標杆,採用MLA(多頭潛在注意力)和DeepSeek MoE架構,總參數達6710億,每個token可激活370億參數。它在數學推理(如MATH-500測試)和代碼生成(如LiveCodeBench競賽)中表現突出,甚至能與GPT-4o、Claude-3.5-Sonnet等閉源模型競爭。
DeepSeek-R1(2025年1月發布)則聚焦推理能力,性能與OpenAI o1正式版相當,支持上網搜索和PDF閱讀,還開放了數據蒸餾和商業化使用。
如今,DeepSeek又推出了DeepSeek-V3.2和DeepSeek-V3.2-Speciale,DeepSeek-V3.2 的目標是平衡推理能力與輸出長度,適合日常使用,例如問答場景和通用Agent任務場景。DeepSeek-V3.2-Speciale 的目標是將開源模型的推理能力推向極致,探索模型能力的邊界。
而豆包大模型在技術、應用和生態上都實現了顯著突破,已成為國內AI領域的頭部玩家,日均token使用量突破50萬億,穩居中國第一、全球第三。
比如,在技術架構方面,推出混合專家模型(MoE)架構,通過動態稀疏激活技術,將萬億參數模型的推理成本降至行業平均水平的60%,性能槓桿提升至7倍。多模態交互,推出「視覺—語言—控制」三模態融合方案,在汽車工廠實踐中實現缺陷檢測響應時間從分鐘級縮短至秒級。實時語音模型,採用Speech2Speech端到端框架,實現語音對話中真正意義上的語音理解生成端到端,具備高表現力與高情緒承接能力。
統一架構方面,Qwen2.5-VL-32B-Instruct採用統一的Transformer架構和共享向量空間,實現「萬物皆可token化」;跨模態對齊,通過共享「語義中間層」統一表徵,跨模態生成準確性提升40%以上;基準測試方面,在MMMU(多模態理解)測試中得分超過70分,MathVista(數學視覺推理)和DocVQA(文檔視覺問答)測試中達到業界領先水平。
目前,「大模型四小龍」智譜AI、月之暗面、百川智能和MiniMax這四家公司都推出了各自特色的大模型產品。比如智譜AI在技術能力上,實現了參數規模從5萬億到10萬億級的翻倍增長,推理精度也提升到98.5%,接近國際領先水平。新發布的GLM-4.7在編程能力上表現突出,在Vals Index排行榜中拿下開源模型第一,Design Arena勝率和Elo評分也緊追谷歌Gemini。
記者採訪騰訊、小米等方面關於其大語言模型的發展,截至發稿前,對方尚未回覆。
在馬繼鵬看來,他還是更看重有實際應用場景的,就是它在大模型基礎上,開發了很多智能體應用,應用在不同行業,比如醫療行業、圖文生成等,可能以後其市場前景會更好。
展望未來
大語言模型(LLM)的未來發展,可以用「更聰明、更垂直、更貼近生活」來概括。它正從技術突破走向深度應用,在多個領域帶來實實在在的改變。
在業內看來,在技術突破方面,從「模仿」到「自主思考」。可驗證獎勵強化學習(RLVR)成為核心,讓AI能拆解複雜問題、生成推理軌跡,自主探索解決方案。比如OpenAI的o3模型,在數學、代碼等可驗證任務中表現突出。多模態能力持續增強,像GPT-4o已能處理文本、圖像和音頻,成本更低、響應更快。
在應用升級方面,垂直領域專業化。整合編排成為新趨勢,比如Cursor這類應用通過優化提示詞、編排模型調用,將通用模型改造成垂直領域的「專業團隊」。個性化體驗和對話式AI會大幅提升,企業能用LLM提供定製化服務,增強用戶黏性。
智能體方面,本地化智能體如Anthropic的Claude Code(CC)直接部署在用戶設備中,可訪問本地數據,實現低延遲交互,實用價值遠超雲端集羣。編程方面,門檻降低。氛圍編程興起,普通人用自然語言就能構建複雜程序,專業開發者也能突破技術限制,實現輕量化開發;語言翻譯和本地化將顯著進步,LLM能提供更自然、符合語境的翻譯,助力跨語言溝通。交互革新,告別純文本。業內人士指出,可視化交互成為新趨勢,LLM將告別純文本,進入更直觀、更豐富的交互時代。隱私保護技術方面,將建立用戶信任,確保LLM應用符合倫理標準。
展望未來,挑戰與機遇並存。業內人士認為,數據多樣性與質量是主要瓶頸,需提升數據來源和標註質量。模型可解釋性和透明度不足,需加強監管和防範措施。技術標準與規範缺乏,需制定統一標準,提升開發效率。
馬繼鵬認為,大模型企業未來的發展方向,無非就是兩個:第一,就是像DeepSeek這類,在基礎能力、技術能力方面,其會走得越來越強,代表中國和OpenAI在技術方面競爭。第二,就是在應用方面可能會更厲害。在應用方面,可能有兩個重要的方向:一是比較虛擬的,比如圖文生成、視頻生成,它本質上是結合目前互聯網上的大數據給用戶提供一些比較可靠的答案;還有一個應用方向,就是在具身智能領域的應用,具身智能其實是一個物理的人工智能,但是其大腦還是需要大模型的,這是一個非常好的應用方向,而且具身智能也是未來幾年國家鼓勵發展的一個方向。
(文章來源:中國經營報)