万字深度:英伟达仍是AI变革最大赢家

数字开物
27 Feb

美国知名科技分析师Ben Thompson表示,即使竞争不断压低API的价格,但进一步激励模型开发者们推出具有差异化的产品和功能,各研究实验室竞相投入新型基础模型的研发,以期实现人工智能的自我完善。英伟达及其代工商台积电无疑是这场变革的最大赢家。

2月25日,美国知名科技分析师Ben Thompson在最新发表的芯片深度分析文章中指出,AI行业正处于“黄金时代”,但同时芯片供应链面临着挑战。

Thompson分析了当前顶级AI模型间的竞争格局,指出Anthropic最近发布的Claude Sonnet 3.7计算规模上仍属于GPT-4级别。相比之下,xAI的Grok 3更像是一次计算能力的阶梯式提升,至于OpenAI,他指出OpenAI已成为“一家意外的消费科技公司”,这一转变可能是近年内部动荡的根本原因。

文章还分析了AMD面临的软件挑战、华为Ascend芯片的进展,以及包括AWS(Trainium)、微软(Maia)、谷歌(TPU)和Meta(MTIA)在内的超大规模科技公司自研芯片的情况。Thompson表示,英伟达仍然是 AI 芯片领域的最大赢家。

文章最后,Thompson提出了几项具体建议,包括结束在美国建设成熟工艺晶圆厂、加强英特尔代工业务、补贴英伟达在英特尔代工厂生产芯片等。

以下是文章,经翻译编辑

昨天,Anthropic发布了ClaudeSonnet3.7。随后,DylanPatel开玩笑说,Anthropic似乎很避讳数字“4”,因为“4”在中文里谐音“死亡”,这成了当日最佳笑话。

言归正传。EthanMollick在一篇文章中提出,Anthropic没有提升主版本号,是因为就算力而言,Sonnet3.7仍属于GPT-4同级别的模型。

这篇文章发布后,我联系了Anthropic,他们告诉我,Sonnet3.7并非计算量达到10^26FLOPs的模型,训练成本也未达到数千万美元,不过他们未来的模型规模会更大。我已经用这些信息更新了文章。唯一值得注意的修改是,Claude3现在被称为高级模型,而非Gen3模型。

我欣赏Mollick的工作,但不同意他那种中立的命名方式:谁先达到新的模型世代水平,谁就应该获得该代际的命名权。换句话说,如果第二代模型达到了GPT-4的水平,那么第三代模型就应该达到Grok3的水平。

此外,虽然Sonnet3.7是Sonnet3.5的迭代升级,在个性和编码能力方面实现了令人欣喜的融合,这或许得益于Anthropic在后训练阶段采用的独特方法。但Grok3给人的感觉截然不同,它更像是计算能力大幅提升的直接产物,仅辅以少量人工反馈强化学习(RLHF)。Grok3的回答更深入、更详细(模型非常出色!),但经常过于冗长(人工反馈方面有所欠缺!);它能准确解答数学难题(模型很棒!),但解题步骤的解释略显晦涩(人工反馈方面有所欠缺!)。Grok3也更倾向于生成一些违禁内容,但深入挖掘会发现其内核与类似4chan的匿名社区探索。

Grok3,相比之前的所有模型,更像是提炼后的互联网;它是我目前最喜欢的模型。

Grok3也在提醒我们速度的重要性,并由此揭示了基础模型在当今人工智能驱动的推理世界中依然占据重要地位的原因。Grok3的速度明显优于竞争对手,从而带来了更出色的用户体验;更普遍地说,对话比拼的是快速反应,而不是深度思考。我希望后者能胜任研究或需要智能体执行的任务;而前者则能在聊天机器人或语音交互界面中为用户带来更优质的消费级体验。

与此同时,ChatGPT依然保持着最佳的产品体验——尤其是其Mac应用程序,体验远胜Claude——并且它以更加用户友好的方式处理更多面向消费者的用例,例如数学家庭作业。DeepResearch在性能上明显超越所有竞争对手(包括Grok的“DeepSearch”功能),而且在我看来,DeepResearch是目前最接近AGI的体验。

然而,OpenAI最大的资产仍然是ChatGPT品牌及其建立的品牌认知度和用户心智份额。首席运营官BradLightcap最近告诉CNBC,ChatGPT的周活跃用户已突破4亿,在不到3个月的时间内激增了33%。正如我在ChatGPT发布四个月后所说,OpenAI是一家“意外走红”的消费科技公司。消费科技公司不仅最难创建,也极有可能成为最具价值的企业;与那些只提供API的研究机构相比,消费科技公司需要完全不同的公司文化和价值链。我推测,这正是推动OpenAI在过去两年半时间里发生剧变的根本原因:OpenAI的老员工最初并没有计划将公司打造成下一个谷歌搜索或Meta,而微软也不甘心仅仅成为一家提供零部件、却无法掌控消费级关系的公司。

然而,事实上OpenAI的步伐还是慢了:无论“广告支持”这个想法多么令AI研究人员难以接受,该公司现在就应该推出这样的版本。DeepSeek现象也揭示了一个重要事实:许多消费者并不了解OpenAI最好的模型有多好,因为他们不是付费客户。让免费用户能够经济高效地使用最好的模型,这完全符合OpenAI的竞争利益,而这意味着广告。更重要的是,广告模式是消费科技公司实现全球扩张的必经之路,这既可以最大限度地扩大潜在市场,还能持续提升用户平均收益(当然,这并非排斥订阅模式;事实上,“广告+订阅”是消费者内容业务的最终形态)。

DeepSeek近期备受瞩目,部分原因在于其与Grok3形成了鲜明对比。DeepSeek的V3和R1模型性能卓越,是GPT-4级别中值得尊敬的竞争对手,其成功源于在基础设施和模型层面的卓越工程设计。相比之下,Grok3只是购买了最顶级的Nvidia芯片,利用公司的网络构建了迄今为止最大的计算集群,并推出了一个更好的模型,但并没有好到天文数字的程度。

DeepSeek作为一家中国公司,这一点至关重要,具体原因将在后文阐述。同样重要的是,DeepSeek秉持开放实验室的精神,定期发布论文、完整的模型权重和底层源代码。其模型不仅优于Meta的Llama模型,而且更加开放(不受“准开放”许可证的限制),为“最低开放能力”树立了标杆。任何性能低于或等同于DeepSeek的模型,都应毫无保留地实现开放。既然用户可以直接运行DeepSeek,安全方面的顾虑便显得多余。而对于那些性能较弱且封闭的模型而言,因封闭性而损失的普及度和关注度,与所谓的竞争担忧相比,显得微不足道。

与此同时,DeepSeek和Llama都对定价构成了巨大的压力;为了应对这家中国研究实验室的发布,中美两国的API成本均有所下降。从长远来看,实现可持续盈利的途径主要有三:一是在基础设施方面拥有成本优势(如谷歌),二是具备可持续的模型能力优势(如Claude在特定领域的专长),三是成为市场聚合者(这正是OpenAI应通过ChatGPT实现的战略目标)。

AI芯片的现状

当前人工智能领域呈现一片欣欣向荣的景象,这无疑是利好消息(仅对“末日概率”高度担忧者除外)。即使竞争不断压低API的价格,但进一步激励模型开发者们推出具有差异化的产品和功能,各研究实验室竞相投入新型基础模型的研发,以期实现人工智能的自我完善。

英伟达及其代工商台积电无疑是这场变革的最大赢家。DeepSeek的成功正导致中国市场对H20芯片的需求激增。H20是英伟达为了遵守出口管制而推出的H200芯片的降规版本,降低了计算能力和带宽。与此同时,xAI刚刚表明,参与竞争的最快方式就是购买最好的芯片。DeepSeek的创新将提高其他模型的效率,但有理由认为,这些效率的提升是芯片禁令的间接影响。因此,对于那些能够直接购买到顶级芯片的公司而言,过去可能没有主动寻求类似的效率提升——但未来肯定会借鉴这些创新成果!——这也是可以理解的。

刚才提到的后一点尤其对AMD构成挑战。SemiAnalysis去年底发布了一份详尽且尖锐的分析报告,揭示了AMD作为英伟达的竞争对手,其软件相对于硬件而言是多么不足。AMD承诺会改进软件,但坦率地说,“卓越的芯片却受限于糟糕的软件”一直是AMD在过去五十年发展历程中的常态。一些公司,例如Meta或微软,可能会投入精力来开发更好的软件,但研究实验室既没有时间,也没有相关的专业知识。

不过,人工智能芯片面临的主要瓶颈——尤其是在推理方面——不一定在于芯片速度,而是内存带宽。而内存带宽在现有工艺水平上仍然有提升空间。此外,为了在一定程度上缓解使用效率较低芯片带来的问题,一种方法是简单地建设更多高功率的数据中心,而这恰恰是中国更擅长的。中国在这方面比美国更具优势。然而,最重要的是,中国科技公司有足够的动力和软件技术实力,将Ascend系列芯片打造成一个有力的市场竞争者,尤其是在推理计算领域。

除了英伟达/台积电和华为/中芯国际之外,还有一类玩家也值得关注,那就是自行设计芯片的超大规模云服务商。他们有的选择独立设计芯片,例如亚马逊云服务的Trainium和微软的Maia;有的则与博通合作,例如谷歌的TPU和Meta的MTIA。这些厂商的研发投入在能力和侧重点上各有不同——例如,谷歌在TPU上已经投入了十年之久,并使用TPU训练自己的模型;下一代Anthropic模型也正在Trainium上进行训练;Meta的MTIA主要用于推荐系统,而非生成式AI;而微软的Maia项目还处于发展初期。但它们都有一个共同点,即这些芯片都由台积电代工。

台积电和英特尔

台积电占据主导地位其实并不令人意外。的确,包括本网站在内的许多文章都分析过英特尔的失利和台积电的崛起。但即便英特尔能够保持技术领先,它仍然面临着一个转型难题:英特尔需要从一家设计和制造自有芯片的集成器件制造商,转型为一家专业的芯片代工厂。后者需要具备完善的客户服务、丰富的IP库以及成熟的代工经验,才能为第三方客户(例如我刚才提到的那些企业)制造芯片。

举例来说,英伟达即使在英特尔拥有领先的制程工艺时,也选择在台积电(以及三星)生产芯片。事实上,正是台积电的创立及其纯晶圆代工模式,才使得英伟达的诞生和发展成为可能。

这也意味着,台积电不仅具备先进制程产能,同时也具备成熟制程产能。世界上有大量的芯片——无论是用于AI服务器,还是从汽车、音响到冰箱等各种设备——并不需要最尖端的制程工艺。这些芯片可以受益于台积电仍然在维护的、已完成折旧的晶圆厂所提供的低成本优势,这些工厂主要位于中国台湾。而台积电又可以将这些现金流——以及先进制程不断上涨的价格带来的利润——用于投资建设最先进的新工厂,从而进一步巩固其在先进制程领域的领先地位。

先进制程晶圆厂的建造成本持续飙升,这意味着量产规模至关重要。因此,早在2013年本网站创立之初,我就清楚地认识到英特尔需要转型为一家代工厂。然而,不幸的是,英特尔并未采纳我的建议,而是更倾向于坐享云服务器需求带来的股价飙升。时间快进到2021年,此时的英特尔——不仅失去了先进制程的领先地位,其云服务器业务的市场份额也正不断被AMD蚕食,而AMD正是凭借台积电更先进的制程工艺实现了强势复苏。在PatGelsinger的领导下,英特尔试图再次转型为代工厂。但不幸的是,公司日益萎缩的现金流甚至超过了其代工业务的客户规模,而且其代工客户也主要是一些实验性芯片项目或x86架构的衍生产品。

英特尔的核心问题可以归结为上文提到的观点:转型为代工厂不仅仅是拥有先进制程。英特尔本有可能与那些渴望采用全球最先进工艺的客户合作,共同发展代工所需的技能。但一旦英特尔连先进制程的优势都失去,就没有任何优势可以提供给客户了。既然有台积电这样的成熟选项,苹果、AMD或英伟达就没有任何理由去冒巨大的风险与英特尔合作。

中国与变化的世界

我曾在去年秋天的《一个建设的机会》一文中讲述过,为什么如此多的半导体产业最终落户亚洲:

半导体对于硅谷的历史至关重要,它们不仅赋予了这个地区名称,更重要的是塑造了这里的文化:芯片需要巨额的前期投资,但相对于大多数其他制成品而言,它们的边际成本极低;这种经济现实推动了风险投资模式的发展,为那些有可能通过规模化获得理论上无限回报的公司提供了不受约束的启动资金。这种模式在软件领域表现得甚至更好,因为软件是完全可复制的。

这段历史始于1956年,当时威廉·肖克利创立了肖克利半导体实验室,以商业化他在贝尔实验室帮助发明的晶体管;他选择在山景城建厂是为了离他生病的母亲近一些。一年后,由罗伯特·诺伊斯领导的“叛逆八人帮”离开了肖克利实验室,并在附近创立了仙童半导体公司。六年之后,仙童半导体公司在中国香港开设了一家工厂,用于组装和测试半导体。组装需要手动将导线连接到半导体芯片上,这是一项劳动密集且单调的任务,在美国工资约为每小时2.50美元的情况下,在经济上是不可行的;中国香港的工资只有美国的十分之一。四年后,德州仪器在中国台湾开设了一家工厂,那里的工资是每小时0.19美元;两年后,仙童半导体公司在新加坡开设了另一家工厂,那里的工资是每小时0.11美元。

换句话说,你可以这样认为,硅谷的经典故事并非完全真实。芯片确实存在边际成本,但这种边际成本,在硅谷创立后不到十年内,就被转移到了亚洲。

我在那篇文章中回顾了这种外包是如何成为美国政府的一项有意为之的政策,并进一步讨论了战后“美国治下的和平”的全球秩序。这一秩序将美国消费市场置于全球贸易的中心,并以美元作为结算货币。我还阐述了为什么这种秩序不可避免地导致了美国制造业的衰落,以及中国的崛起。现在回过头来看,中国的体量实在太庞大了,以至于美国难以承受其带来的影响。

芯片是现代经济的基石,支撑着经济的方方面面;人工智能的兴起,以及由此可能带来的巨大收益,只会使对芯片的需求变得更加迫切。

英特尔和先进制程

接下来是英特尔以及对本土先进制程产能的需求,这在某些方面是最难解决的问题。

首先,美国应该策划将英特尔的x86芯片业务以象征性的价格剥离给博通或高通。接受这项业务的公司的真正成本将是获得有保证的订单,不仅包括为英特尔代工厂生产英特尔芯片,还包括将他们现有芯片的很大一部分订单转移给英特尔代工厂。这将为英特尔代工厂的启动奠定客户基础。

其次,美国应该提议补贴英伟达在英特尔代工厂生产芯片。是的,这是一项价值数十亿美元的提议,但这是确保美国人工智能产业能够立足于美国本土晶圆厂的最短、最快路径。

第三,如果英伟达拒绝——考虑到更换代工厂可能带来的风险,他们很可能会拒绝——那么美国应该大量订购英特尔GaudiAI加速器,建立数据中心来部署它们,并向希望构建自己AI模型的公司和初创企业免费提供这些加速器,但前提是所有相关技术都必须开源。

第四,美国应该大力补贴芯片初创公司在英特尔代工厂进行生产,但条件是,所有为实际制造芯片而开发的衍生知识产权——与芯片本身“秘方”无关的基础模块——都必须开源。

第五,美国应该为所有在美国制造的芯片上创建的模型提供保障,使其免受任何版权侵犯,但前提是,用于训练模型的数据必须免费公开。

人工智能正处在一个激动人心的发展阶段,但也面临着非常不稳定的局面。我相信,这项计划,以及它所包含的所有风险和牺牲,是确保所有正在萌芽的新兴技术能够真正扎根并改变世界的最佳途径。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10