高盛：DeepSeek V4对中国AI意味着什么？

高盛认为DeepSeek V4通过混合注意力等架构创新，大幅压缩长上下文推理成本，核心意义在于以更低成本支撑复杂智能体应用落地。V4明确押注华为昇腾950，预计2026年下半年量产后API定价将显著下降。国内AI模型竞争加剧，编程能力与多模态成差异化关键。高盛维持云计算与数据中心首选评级。

高盛认为，DeepSeek V4的核心意义在于以更低成本支持更复杂的智能体应用落地，从而打开AI应用规模化的新空间。

追风交易台消息，4月24日，高盛Ronald Keung团队发表研报，全新开源的V4模型是DeepSeek效率优先、开源路线的延续。

在技术层面，V4通过架构升级实现长上下文窗口的大幅降本，并明确押注华为国产芯片。在市场层面，这一发布加速了中国AI模型竞争的白热化，编程能力、任务完成率与多模态将成为定价权的核心分水岭。

高盛维持对云计算与数据中心板块的推荐评级，算力成本效率的持续改善将推动AI应用加速渗透，企业端AI代理增长与消费端AI助手的双轮驱动，将支撑云服务定价能力持续提升。

V4架构升级，以更少内存撑起更长上下文

DeepSeek V4以Pro和Flash两个版本发布。

Pro版本为旗舰规模，参数量达1.6万亿（激活参数490亿）；Flash版本相对轻量，参数量2840亿（激活参数130亿）。两款模型均支持100万词元token的超长上下文窗口，与美国顶尖模型（SOTA）持平，但所需内存与KV缓存大幅压缩。

根据高盛报告，V4 Pro在100万上下文场景下，单词元token推理所需浮点运算量（FLOPs）仅为DeepSeek V3.2的27%，KV缓存占用仅为10%；V4 Flash则更为激进，FLOPs降至10%，KV缓存压缩至7%。

这一效率跃升依托三项关键架构创新实现：

混合注意力机制方面，V4引入压缩稀疏注意力（CSA）与重度压缩注意力（HCA）的混合架构。CSA先对KV缓存进行序列维度压缩再执行稀疏注意力计算，HCA则采用更激进的压缩但保留稠密注意力，两者协同大幅降低长输入所需的临时内存。
训练稳定性方面，V4引入mHC机制，增强信息在多层网络中传递的稳定性；
同时采用Muon作为主训练优化器（部分模块保留AdamW），以适应比V3更复杂的网络架构，提升训练过程的收敛质量。

高盛指出，上述效率增益对长时任务场景意义更为显著，典型用例是需要处理大量上下文的长周期代理任务。

值得注意的是，DeepSeek当前仍专注于基础文本模型，而阿里巴巴、字节跳动、MiniMax等互联网巨头与独立模型玩家则更倾向于多模态/全模态路线，在AGI探索路径上存在明显分化。

国产芯片加速落地，华为升腾950铺路降价空间

此次V4发布的另一重要信号，是DeepSeek明确将华为升腾950超级节点的量产纳入其商业路径。

DeepSeek预计随着华为Ascend 950超级节点在2026年下半年实现大规模供货，V4 Pro版本的API定价将迎来显著下降。

高盛报告显示，这一表态具有双重意涵：

其一，DeepSeek的成本竞争力将进一步强化，为更广泛的应用落地创造条件；
其二，在芯片持续收紧的背景下，中国顶尖AI模型向国产算力迁移的趋势得到头部玩家的明确背书。

从目前定价来看，高盛数据显示V4 Pro在主流API平台上的定价已具备竞争力，而随着国内算力供给扩容，这一优势预计将在2026年下半年进一步扩大。

国内AI模型竞争进入差异化阶段

DeepSeek V4的开源发布，迅速触发中国AI模型阵营新一轮密集跟进。

据高盛梳理，近期竞相推出新模型的玩家包括：Kimi K2.6、阿里巴巴Qwen3.6-Max、腾讯Hy3预览版、小米V2.5，以及预计将于5月推出的MiniMax M3/Hailuo。

在高盛看来，未来决定各模型定价权的关键差异化因素将集中在两个维度：

编程/任务完成成功率，智谱的GLM模型在代码能力排名中名列前茅；
多模态能力，字节跳动、阿里巴巴和MiniMax在这一方向投入最为深入。

研报指出，两类玩家优劣势清晰：

独立AI玩家比如MiniMax，组织效率高、决策链路短，即使基础文本API定价极低，仍能实现40%的毛利率，这是高盛的预测数据。
互联网大厂比如字节、腾讯、阿里，核心业务现金流充沛，更适合布局AI基础设施与云赛道，需要设置独立的AI团队激励方案留存人才，比如字节豆包团队已有独立激励。

值得关注的是，高盛报告援引新闻报道称，腾讯和阿里巴巴正在洽谈以逾200亿美元估值投资DeepSeek，而智谱和MiniMax的最新市值分别约为530亿美元和310亿美元，这一潜在交易折射出巨头对稀缺顶层AI能力的争夺逻辑。

首选赛道逻辑不变：云计算与数据中心

高盛维持云计算与数据中心为中国互联网首选子赛道的判断，逻辑在于：

AI词元Token需求的持续增长将驱动云服务采购量上升；
企业客户与AI代理的增长正推动云/词元Token定价能力改善；
消费级AI助手的持续渗透贡献增量需求。

在To-B企业云市场，阿里巴巴以最大外部AI云营收规模领跑；在To-C消费市场，字节跳动目前是AI聊天机器人日均Token用量最大的平台，中国AIGC应用的DAU整体保持强劲增长，2026年3月环比增速高达36%。

重点推荐标的方面，高盛持续强调万国数据、世纪互联、阿里巴巴和金山云四只核心标的，作为把握中国AI基础设施扩张红利的核心配置方向。

此外，第二梯队是电商与出行赛道，第三梯队是AI模型相关标的，第四梯队是游戏与娱乐赛道。

免责声明：投资有风险，本文并非投资建议，以上内容不应被视为任何金融产品的购买或出售要约、建议或邀请，作者或其他用户的任何相关讨论、评论或帖子也不应被视为此类内容。本文仅供一般参考，不考虑您的个人投资目标、财务状况或需求。TTM对信息的准确性和完整性不承担任何责任或保证，投资者应自行研究并在投资前寻求专业建议。

老虎证券

高盛：DeepSeek V4对中国AI意味着什么？

V4架构升级，以更少内存撑起更长上下文

国产芯片加速落地，华为升腾950铺路降价空间

国内AI模型竞争进入差异化阶段

首选赛道逻辑不变：云计算与数据中心

热议股票