高盛:DeepSeek V4对中国AI意味着什么?

华尔街见闻
昨天

高盛认为DeepSeek V4通过混合注意力等架构创新,大幅压缩长上下文推理成本,核心意义在于以更低成本支撑复杂智能体应用落地。V4明确押注华为昇腾950,预计2026年下半年量产后API定价将显著下降。国内AI模型竞争加剧,编程能力与多模态成差异化关键。高盛维持云计算与数据中心首选评级。

高盛认为,DeepSeek V4的核心意义在于以更低成本支持更复杂的智能体应用落地,从而打开AI应用规模化的新空间。

追风交易台消息,4月24日,高盛Ronald Keung团队发表研报,全新开源的V4模型是DeepSeek效率优先、开源路线的延续。

在技术层面,V4通过架构升级实现长上下文窗口的大幅降本,并明确押注华为国产芯片。在市场层面,这一发布加速了中国AI模型竞争的白热化,编程能力、任务完成率与多模态将成为定价权的核心分水岭。

高盛维持对云计算数据中心板块的推荐评级,算力成本效率的持续改善将推动AI应用加速渗透,企业端AI代理增长与消费端AI助手的双轮驱动,将支撑云服务定价能力持续提升。

V4架构升级,以更少内存撑起更长上下文

DeepSeek V4以Pro和Flash两个版本发布。

Pro版本为旗舰规模,参数量达1.6万亿(激活参数490亿);Flash版本相对轻量,参数量2840亿(激活参数130亿)。两款模型均支持100万词元token的超长上下文窗口,与美国顶尖模型(SOTA)持平,但所需内存与KV缓存大幅压缩。

根据高盛报告,V4 Pro在100万上下文场景下,单词元token推理所需浮点运算量(FLOPs)仅为DeepSeek V3.2的27%,KV缓存占用仅为10%;V4 Flash则更为激进,FLOPs降至10%,KV缓存压缩至7%。

这一效率跃升依托三项关键架构创新实现:

  • 混合注意力机制方面,V4引入压缩稀疏注意力(CSA)与重度压缩注意力(HCA)的混合架构。CSA先对KV缓存进行序列维度压缩再执行稀疏注意力计算,HCA则采用更激进的压缩但保留稠密注意力,两者协同大幅降低长输入所需的临时内存。

  • 训练稳定性方面,V4引入mHC机制,增强信息在多层网络中传递的稳定性;

  • 同时采用Muon作为主训练优化器(部分模块保留AdamW),以适应比V3更复杂的网络架构,提升训练过程的收敛质量。

高盛指出,上述效率增益对长时任务场景意义更为显著,典型用例是需要处理大量上下文的长周期代理任务。

值得注意的是,DeepSeek当前仍专注于基础文本模型,而阿里巴巴、字节跳动、MiniMax等互联网巨头与独立模型玩家则更倾向于多模态/全模态路线,在AGI探索路径上存在明显分化。

国产芯片加速落地,华为升腾950铺路降价空间

此次V4发布的另一重要信号,是DeepSeek明确将华为升腾950超级节点的量产纳入其商业路径。

DeepSeek预计随着华为Ascend 950超级节点在2026年下半年实现大规模供货,V4 Pro版本的API定价将迎来显著下降。

高盛报告显示,这一表态具有双重意涵:

  • 其一,DeepSeek的成本竞争力将进一步强化,为更广泛的应用落地创造条件;

  • 其二,在芯片持续收紧的背景下,中国顶尖AI模型向国产算力迁移的趋势得到头部玩家的明确背书。

从目前定价来看,高盛数据显示V4 Pro在主流API平台上的定价已具备竞争力,而随着国内算力供给扩容,这一优势预计将在2026年下半年进一步扩大。

国内AI模型竞争进入差异化阶段

DeepSeek V4的开源发布,迅速触发中国AI模型阵营新一轮密集跟进。

据高盛梳理,近期竞相推出新模型的玩家包括:Kimi K2.6、阿里巴巴Qwen3.6-Max、腾讯Hy3预览版、小米V2.5,以及预计将于5月推出的MiniMax M3/Hailuo。

在高盛看来,未来决定各模型定价权的关键差异化因素将集中在两个维度:

  • 编程/任务完成成功率智谱的GLM模型在代码能力排名中名列前茅;

  • 多模态能力,字节跳动、阿里巴巴和MiniMax在这一方向投入最为深入。

研报指出,两类玩家优劣势清晰:

  • 独立AI玩家比如MiniMax,组织效率高、决策链路短,即使基础文本API定价极低,仍能实现40%的毛利率,这是高盛的预测数据。

  • 互联网大厂比如字节、腾讯、阿里,核心业务现金流充沛,更适合布局AI基础设施与云赛道,需要设置独立的AI团队激励方案留存人才,比如字节豆包团队已有独立激励。

值得关注的是,高盛报告援引新闻报道称,腾讯和阿里巴巴正在洽谈以逾200亿美元估值投资DeepSeek,而智谱和MiniMax的最新市值分别约为530亿美元和310亿美元,这一潜在交易折射出巨头对稀缺顶层AI能力的争夺逻辑。

首选赛道逻辑不变:云计算与数据中心

高盛维持云计算与数据中心为中国互联网首选子赛道的判断,逻辑在于:

  • AI词元Token需求的持续增长将驱动云服务采购量上升;

  • 企业客户与AI代理的增长正推动云/词元Token定价能力改善;

  • 消费级AI助手的持续渗透贡献增量需求。

在To-B企业云市场,阿里巴巴以最大外部AI云营收规模领跑;在To-C消费市场,字节跳动目前是AI聊天机器人日均Token用量最大的平台,中国AIGC应用的DAU整体保持强劲增长,2026年3月环比增速高达36%。

重点推荐标的方面,高盛持续强调万国数据世纪互联、阿里巴巴和金山云四只核心标的,作为把握中国AI基础设施扩张红利的核心配置方向。

此外,第二梯队是电商与出行赛道,第三梯队是AI模型相关标的,第四梯队是游戏与娱乐赛道。

免责声明:投资有风险,本文并非投资建议,以上内容不应被视为任何金融产品的购买或出售要约、建议或邀请,作者或其他用户的任何相关讨论、评论或帖子也不应被视为此类内容。本文仅供一般参考,不考虑您的个人投资目标、财务状况或需求。TTM对信息的准确性和完整性不承担任何责任或保证,投资者应自行研究并在投资前寻求专业建议。

热议股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10