高盛:DeepSeek V4对中国AI意味着什么?

华尔街见闻
Yesterday

高盛认为DeepSeek V4通过混合注意力等架构创新,大幅压缩长上下文推理成本,核心意义在于以更低成本支撑复杂智能体应用落地。V4明确押注华为昇腾950,预计2026年下半年量产后API定价将显著下降。国内AI模型竞争加剧,编程能力与多模态成差异化关键。高盛维持云计算与数据中心首选评级。

高盛认为,DeepSeek V4的核心意义在于以更低成本支持更复杂的智能体应用落地,从而打开AI应用规模化的新空间。

追风交易台消息,4月24日,高盛Ronald Keung团队发表研报,全新开源的V4模型是DeepSeek效率优先、开源路线的延续。

在技术层面,V4通过架构升级实现长上下文窗口的大幅降本,并明确押注华为国产芯片。在市场层面,这一发布加速了中国AI模型竞争的白热化,编程能力、任务完成率与多模态将成为定价权的核心分水岭。

高盛维持对云计算数据中心板块的推荐评级,算力成本效率的持续改善将推动AI应用加速渗透,企业端AI代理增长与消费端AI助手的双轮驱动,将支撑云服务定价能力持续提升。

V4架构升级,以更少内存撑起更长上下文

DeepSeek V4以Pro和Flash两个版本发布。

Pro版本为旗舰规模,参数量达1.6万亿(激活参数490亿);Flash版本相对轻量,参数量2840亿(激活参数130亿)。两款模型均支持100万词元token的超长上下文窗口,与美国顶尖模型(SOTA)持平,但所需内存与KV缓存大幅压缩。

根据高盛报告,V4 Pro在100万上下文场景下,单词元token推理所需浮点运算量(FLOPs)仅为DeepSeek V3.2的27%,KV缓存占用仅为10%;V4 Flash则更为激进,FLOPs降至10%,KV缓存压缩至7%。

这一效率跃升依托三项关键架构创新实现:

  • 混合注意力机制方面,V4引入压缩稀疏注意力(CSA)与重度压缩注意力(HCA)的混合架构。CSA先对KV缓存进行序列维度压缩再执行稀疏注意力计算,HCA则采用更激进的压缩但保留稠密注意力,两者协同大幅降低长输入所需的临时内存。

  • 训练稳定性方面,V4引入mHC机制,增强信息在多层网络中传递的稳定性;

  • 同时采用Muon作为主训练优化器(部分模块保留AdamW),以适应比V3更复杂的网络架构,提升训练过程的收敛质量。

高盛指出,上述效率增益对长时任务场景意义更为显著,典型用例是需要处理大量上下文的长周期代理任务。

值得注意的是,DeepSeek当前仍专注于基础文本模型,而阿里巴巴、字节跳动、MiniMax等互联网巨头与独立模型玩家则更倾向于多模态/全模态路线,在AGI探索路径上存在明显分化。

国产芯片加速落地,华为升腾950铺路降价空间

此次V4发布的另一重要信号,是DeepSeek明确将华为升腾950超级节点的量产纳入其商业路径。

DeepSeek预计随着华为Ascend 950超级节点在2026年下半年实现大规模供货,V4 Pro版本的API定价将迎来显著下降。

高盛报告显示,这一表态具有双重意涵:

  • 其一,DeepSeek的成本竞争力将进一步强化,为更广泛的应用落地创造条件;

  • 其二,在芯片持续收紧的背景下,中国顶尖AI模型向国产算力迁移的趋势得到头部玩家的明确背书。

从目前定价来看,高盛数据显示V4 Pro在主流API平台上的定价已具备竞争力,而随着国内算力供给扩容,这一优势预计将在2026年下半年进一步扩大。

国内AI模型竞争进入差异化阶段

DeepSeek V4的开源发布,迅速触发中国AI模型阵营新一轮密集跟进。

据高盛梳理,近期竞相推出新模型的玩家包括:Kimi K2.6、阿里巴巴Qwen3.6-Max、腾讯Hy3预览版、小米V2.5,以及预计将于5月推出的MiniMax M3/Hailuo。

在高盛看来,未来决定各模型定价权的关键差异化因素将集中在两个维度:

  • 编程/任务完成成功率智谱的GLM模型在代码能力排名中名列前茅;

  • 多模态能力,字节跳动、阿里巴巴和MiniMax在这一方向投入最为深入。

研报指出,两类玩家优劣势清晰:

  • 独立AI玩家比如MiniMax,组织效率高、决策链路短,即使基础文本API定价极低,仍能实现40%的毛利率,这是高盛的预测数据。

  • 互联网大厂比如字节、腾讯、阿里,核心业务现金流充沛,更适合布局AI基础设施与云赛道,需要设置独立的AI团队激励方案留存人才,比如字节豆包团队已有独立激励。

值得关注的是,高盛报告援引新闻报道称,腾讯和阿里巴巴正在洽谈以逾200亿美元估值投资DeepSeek,而智谱和MiniMax的最新市值分别约为530亿美元和310亿美元,这一潜在交易折射出巨头对稀缺顶层AI能力的争夺逻辑。

首选赛道逻辑不变:云计算与数据中心

高盛维持云计算与数据中心为中国互联网首选子赛道的判断,逻辑在于:

  • AI词元Token需求的持续增长将驱动云服务采购量上升;

  • 企业客户与AI代理的增长正推动云/词元Token定价能力改善;

  • 消费级AI助手的持续渗透贡献增量需求。

在To-B企业云市场,阿里巴巴以最大外部AI云营收规模领跑;在To-C消费市场,字节跳动目前是AI聊天机器人日均Token用量最大的平台,中国AIGC应用的DAU整体保持强劲增长,2026年3月环比增速高达36%。

重点推荐标的方面,高盛持续强调万国数据世纪互联、阿里巴巴和金山云四只核心标的,作为把握中国AI基础设施扩张红利的核心配置方向。

此外,第二梯队是电商与出行赛道,第三梯队是AI模型相关标的,第四梯队是游戏与娱乐赛道。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10