高盛認為DeepSeek V4通過混合注意力等架構創新,大幅壓縮長上下文推理成本,核心意義在於以更低成本支撐複雜智能體應用落地。V4明確押注華為昇騰950,預計2026年下半年量產後API定價將顯著下降。國內AI模型競爭加劇,編程能力與多模態成差異化關鍵。高盛維持雲計算與數據中心首選評級。
高盛認為,DeepSeek V4的核心意義在於以更低成本支持更復雜的智能體應用落地,從而打開AI應用規模化的新空間。
追風交易台消息,4月24日,高盛Ronald Keung團隊發表研報,全新開源的V4模型是DeepSeek效率優先、開源路線的延續。
在技術層面,V4通過架構升級實現長上下文窗口的大幅降本,並明確押注華為國產芯片。在市場層面,這一發布加速了中國AI模型競爭的白熱化,編程能力、任務完成率與多模態將成為定價權的核心分水嶺。
高盛維持對雲計算與數據中心板塊的推薦評級,算力成本效率的持續改善將推動AI應用加速滲透,企業端AI代理增長與消費端AI助手的雙輪驅動,將支撐雲服務定價能力持續提升。
V4架構升級,以更少內存撐起更長上下文
DeepSeek V4以Pro和Flash兩個版本發布。
Pro版本為旗艦規模,參數量達1.6萬億(激活參數490億);Flash版本相對輕量,參數量2840億(激活參數130億)。兩款模型均支持100萬詞元token的超長上下文窗口,與美國頂尖模型(SOTA)持平,但所需內存與KV緩存大幅壓縮。
根據高盛報告,V4 Pro在100萬上下文場景下,單詞元token推理所需浮點運算量(FLOPs)僅為DeepSeek V3.2的27%,KV緩存佔用僅為10%;V4 Flash則更為激進,FLOPs降至10%,KV緩存壓縮至7%。
這一效率躍升依託三項關鍵架構創新實現:
混合注意力機制方面,V4引入壓縮稀疏注意力(CSA)與重度壓縮注意力(HCA)的混合架構。CSA先對KV緩存進行序列維度壓縮再執行稀疏注意力計算,HCA則採用更激進的壓縮但保留稠密注意力,兩者協同大幅降低長輸入所需的臨時內存。
訓練穩定性方面,V4引入mHC機制,增強信息在多層網絡中傳遞的穩定性;
同時採用Muon作為主訓練優化器(部分模塊保留AdamW),以適應比V3更復雜的網絡架構,提升訓練過程的收斂質量。
高盛指出,上述效率增益對長時任務場景意義更為顯著,典型用例是需要處理大量上下文的長周期代理任務。
值得注意的是,DeepSeek當前仍專注於基礎文本模型,而阿里巴巴、字節跳動、MiniMax等互聯網巨頭與獨立模型玩家則更傾向於多模態/全模態路線,在AGI探索路徑上存在明顯分化。
國產芯片加速落地,華為升騰950鋪路降價空間
此次V4發布的另一重要信號,是DeepSeek明確將華為升騰950超級節點的量產納入其商業路徑。
DeepSeek預計隨着華為Ascend 950超級節點在2026年下半年實現大規模供貨,V4 Pro版本的API定價將迎來顯著下降。
高盛報告顯示,這一表態具有雙重意涵:
其一,DeepSeek的成本競爭力將進一步強化,為更廣泛的應用落地創造條件;
其二,在芯片持續收緊的背景下,中國頂尖AI模型向國產算力遷移的趨勢得到頭部玩家的明確背書。
從目前定價來看,高盛數據顯示V4 Pro在主流API平台上的定價已具備競爭力,而隨着國內算力供給擴容,這一優勢預計將在2026年下半年進一步擴大。
國內AI模型競爭進入差異化階段
DeepSeek V4的開源發布,迅速觸發中國AI模型陣營新一輪密集跟進。
據高盛梳理,近期競相推出新模型的玩家包括:Kimi K2.6、阿里巴巴Qwen3.6-Max、騰訊Hy3預覽版、小米V2.5,以及預計將於5月推出的MiniMax M3/Hailuo。
在高盛看來,未來決定各模型定價權的關鍵差異化因素將集中在兩個維度:
編程/任務完成成功率,智譜的GLM模型在代碼能力排名中名列前茅;
多模態能力,字節跳動、阿里巴巴和MiniMax在這一方向投入最為深入。
研報指出,兩類玩家優劣勢清晰:
獨立AI玩家比如MiniMax,組織效率高、決策鏈路短,即使基礎文本API定價極低,仍能實現40%的毛利率,這是高盛的預測數據。
互聯網大廠比如字節、騰訊、阿里,核心業務現金流充沛,更適合佈局AI基礎設施與雲賽道,需要設定獨立的AI團隊激勵方案留存人才,比如字節豆包團隊已有獨立激勵。
值得關注的是,高盛報告援引新聞報道稱,騰訊和阿里巴巴正在洽談以逾200億美元估值投資DeepSeek,而智譜和MiniMax的最新市值分別約為530億美元和310億美元,這一潛在交易折射出巨頭對稀缺頂層AI能力的爭奪邏輯。
首選賽道邏輯不變:雲計算與數據中心
高盛維持雲計算與數據中心為中國互聯網首選子賽道的判斷,邏輯在於:
AI詞元Token需求的持續增長將驅動雲服務採購量上升;
企業客戶與AI代理的增長正推動雲/詞元Token定價能力改善;
消費級AI助手的持續滲透貢獻增量需求。
在To-B企業雲市場,阿里巴巴以最大外部AI雲營收規模領跑;在To-C消費市場,字節跳動目前是AI聊天機器人日均Token用量最大的平台,中國AIGC應用的DAU整體保持強勁增長,2026年3月按月增速高達36%。
重點推薦標的方面,高盛持續強調萬國數據、世紀互聯、阿里巴巴和金山雲四隻核心標的,作為把握中國AI基礎設施擴張紅利的核心配置方向。
此外,第二梯隊是電商與出行賽道,第三梯隊是AI模型相關標的,第四梯隊是遊戲與娛樂賽道。