SemiAnalysis CEO:模型"近两年最大能力跃迁",让“执行变得极其廉价”,供应链"极度短缺"

华尔街见闻
Apr 24

AI模型迎来“近两年最大能力跃迁”,供应链全线告急,美国民愤情绪一触即发——这是SemiAnalysis创始人Dylan Patel在最新访谈中给出了对当下AI革命最直白、最辛辣的判断。

4月23日,知名半导体及AI行业研究机构SemiAnalysis首席执行官(CEO)Dylan Patel在一场深度访谈中,详细拆解了当前AI行业的供需动态、代际技术突破以及潜在的社会宏观影响。

Patel的公司SemiAnalysis是华尔街和科技投资圈高度关注的AI基础设施独立研究机构,其客户覆盖顶级对冲基金和科技企业。他在访谈中以自身公司的AI使用数据为切入口,引出了对整个AI产业供需格局的深度研判。

他透露,SemiAnalysis去年的AI支出仅为数万美元,但由于员工(甚至是非技术人员)开始疯狂使用Claude等AI工具进行代码编写和数据分析,今年的年化Token支出已经飙升至700万美元。

他指出,Anthropic等头部机构的新模型实现了“近两年最大能力跃迁”,仅用两月便从L4跨越至L6级工程师水平,让“执行变得极其廉价”。然而,这也导致硬件供应链面临“极度短缺”,DRAM价格或将翻两至三倍,台积电2028年资本支出有望触及千亿美元。

值得警惕的是,随着技术向经济系统渗透,底层失业焦虑加剧,预计三个月内美国或爆发针对AI的大规模抗议,公众抵触情绪正成为不可忽视的宏观变量。

模型“近两年最大能力跃迁”

驱动这场Token消耗狂潮的核心,是前沿模型能力的爆炸式增长。

在访谈中,Patel特别提到了Anthropic未公开发布的神秘新模型(代号Mythos)以及最新版的Opus。他指出,随着Scaling Laws(缩放定律)的持续生效,模型的迭代速度正在从过去的六个月大幅压缩至两个月。

“Mythos可能是近两年来模型能力的最大跨越。”Patel强调,“Anthropic最初的目标是在2025年底前让模型达到L4级软件工程师的水平,他们在Opus 4.6上基本实现了这一点。但如果你看Mythos的基准测试,它已经达到了L6级工程师(资深专家)的水平。从L4到L6,他们仅仅用了两个月。”

这种能力的跃迁正在从根本上改变商业世界的运行逻辑。过去,市场的法则是“想法很廉价,执行极其困难”;但在新一代模型的加持下,这一逻辑被彻底重写:

“现在想法廉价且丰富,而执行变得非常容易。因此,只有真正好的想法,才能证明在极其廉价的执行上花费资金是合理的。”

Mythos的出现还验证了一个关键命题:Scaling Laws仍然有效。Patel明确表示,Mythos是一个"materially larger model"(明显更大规模的模型),训练规模等效于10万块Blackwell芯片,且"所有迹象都表明,往模型里砸更多算力,模型就会变得更强"的趋势线依然成立。

供应链“极度短缺”

极端的模型算力需求直接导致了物理世界供应链的全面告急。

Patel指出,尽管云服务商和芯片制造商正在疯狂扩产,但供给侧几乎在每一个节点上都处于“极度短缺”状态,且全产业链的利润率正在不可逆转地扩张。

“随着需求飙升,供应端所有东西的价格都在上涨。”他打破了市场关于GPU使用寿命较短的固有认知:“有人认为GPU的使用寿命不到5年,这完全是胡说八道。现在有3到4年机龄的Hopper集群正在续签未来三四年的合同。有效寿命显然不是5年,甚至可能是7到8年。”

在更广泛的半导体供应链中,短缺现象同样令人咋舌。Patel重点提示了存储芯片和晶圆代工环节的惊人预期:

  • 首先是存储芯片:“真正的增量供应(incremental supply)在2028年之前都不会到来。DRAM的价格将从现在起翻倍甚至翻三倍,因为他们必须通过更高的定价来摧毁部分需求(demand destruction),资本主义经济不搞配给制。”

  • 其次是代工与设备:“人们没有关注到台积电未来的资本支出。到了2028年,台积电的资本支出可能会达到1000亿美元。人们觉得这很疯狂,但这绝对是一个真实的可能性。”

此外,Patel特别强调了两个容易被忽视的瓶颈:

CPU:被严重低估。原因有二:一是强化学习(RL)训练环境完全运行在CPU上,而非GPU;二是AI生成的代码和内容最终都要部署到基于CPU的服务器上运行。"CPU完全售罄,需求在暴增。"

PCB铜箔、玻璃纤维、激光器等小众上游材料:同样供应极度紧张,订单预付款现象普遍,即便毛利率未必大涨,投入资本回报率(ROIC)正在显著提升。

Patel的整体判断是:"经济价值最好的模型所能创造的价值,正在以比我们实际供应Token能力更快的速度增长。这个缺口会持续扩大,模型厂商的利润率会持续扩张,直到硬件供应链里的人也开始说,'等等,为什么我们不把自己的利润也拉上去'。"

美国民愤情绪正在积累

在技术的狂飙突进和资本的疯狂盛宴之外,Patel对AI引发的美国社会情绪发出了极其严厉的预警。

他指出,随着企业利用AI大幅提高效率并可能随之裁员,美国普通大众对AI的敌意正在迅速逼近临界点。

“我认为三个月内,就会出现针对大模型公司的大规模抗议活动。”Patel在访谈中直言不讳。他列举了近期的极端事件:

“Sam Altman的房子在两周内两次被人投掷燃烧 瓶,而新闻评论区里人们竟然在欢呼,这仅仅是个开始。AI现在比政客还要不受欢迎。”

他将这种公众愤怒部分归咎于美国AI公司高管的公关策略失误。他认为,美国头部AI公司的掌舵者(如Sam Altman和Dario Amodei)在面向公众时缺乏魅力,且过于热衷于谈论AI将如何“改变整个世界”和“自动化所有工作”。

“他们需要停止不断谈论未来的能力将如何改变世界,因为普通人与此毫无联系,这只会让他们对这种能力感到恐惧。他们必须开始展示AI能带来的令人振奋的现实用例。”

访谈文字实录译文(由AI辅助翻译)

注:Dylan Patel,半导体研究机构SemiAnalysis首席执行官

主持人Patrick O'Shaughnessy,风险投资公司Positive Sum首席执行官

Dylan Patel:

过去,执行非常重要,因为执行非常困难,而想法则很廉价。现在想法既廉价又充裕,但执行变得非常容易。所以真正重要的,只有那些好想法,才是能够证明在超级廉价的执行上花费是值得的。

主持人:

你跟我讲过一个令人难以置信的故事,关于你自己团队对token的使用今年发生了多么巨大的变化。是的,零售,讲讲那个故事,以及它在教你关于这个世界正在发生什么。

Dylan Patel:

去年,我们以为自己是AI的重度用户。每个人都在用ChatGPT,每个人都在用Claude,每个人都有,你知道,我为公司里任何人提供他们想要的订阅,花费大概在几万美元的量级。今年,花费就直线飙升了。这真的是从去年十二月底Opus推出开始的,其中包括Doug,他是总裁,Douglas。他非常像是在领头冲锋,意义在于像他这样的非技术人员在用AI写代码。所以他基本上慢慢地把整个公司都带进来了。我认为他一直是这方面的领头人。显然,工程师们无论如何都在用,但一月份的花费就开始拐点向上,然后不断飙升、飙升、飙升、飙升。我们签了,你知道,与Anthropic的企业合同,现在已经到了这个地步——我想我上次和你说的时候,花费是500万,对吧?现在实际上是700万的花费。

主持人:

那是上周的事,顺便说一句。

Dylan Patel:

其中很大一部分就是使用量,对吧?真正的情况是,你知道,那些以前从未写过代码的人,现在在用Claude Code,有时一天花几千美元,遍布整个公司。我们现在每年在Claude Code上花700万美元。按照目前的速度,而我们的薪资支出大约在2500万美元左右。所以,你知道,我们在Claude Code上的花费占薪资的比例超过了25%。如果这个轨迹持续下去,那么,你知道,到今年年底,我们在Claude Code上的花费将超过薪资总额的100%,这有点令人恐惧。

Dylan Patel:

幸运的是,我不必在人和AI之间做选择,因为我们公司增长非常快。情况更像是,好吧,我不需要那么快地招人,我可以在AI上花更多钱,而且它确实有效,我们只是增长得更快了。但我认为其他人将开始面对这样一个现实:如果这个人能用Claude Code完成五到十到十五个人的工作,那么突然之间,我或许应该裁员了。

Dylan Patel:

但就目前而言,我认为使用场景非常广泛。举个例子,我们在俄勒冈州有一个逆向工程实验室,我们已经建了一年半了。我们有一堆,你知道,高级显微镜、扫描电子显微镜。这整个实验室的目的是对芯片进行逆向工程。你从中提取架构,获取他们用于制造的材料。这是我们出售的一些数据。分析这些数据是一个非常缓慢的过程。然而,团队里的一个人,他用几千美元的Claude token,就能够创建这个应用程序——它是GPU加速的,运行在我们在Core Weave的一台服务器上。每当我们发给它一张图像,它就能拍下芯片的照片,并叠加标注出每一种材料在哪里。哦,这部分是铜。哦,栅极的这部分是钽。栅极的这部分是锗。栅极的这部分是钴。这样你就可以非常快速地对芯片的整个堆叠结构进行有限元分析。带有仪表盘图形界面,可视化。一切都有了。就花了几千美元的token。

Dylan Patel:

这个人之前在英特尔工作过,他说那曾经是整个团队的工作,负责构建和维护那个系统。现在把这个乘以整个公司的规模。太疯狂了。

Dylan Patel:

另一个我认为非常有趣的例子是Malcolm。他之前是一家大型银行的经济学家。那家银行的经济学家部门大概有一两百人。他构建的东西是有史以来最令人难以置信的。他把各种不同的数据都接入进来,你知道,Fred数据以及所有其他数据,对不起,就业报告以及来自各种API的其他数据。我们与一些机构签了几份合同,获得API来访问数据,把所有数据都整合进来,开始跑回归,开始研究各种经济变革从通缩、通胀角度对经济的影响。美国劳工统计局,整个劳工统计局有整整一套大约2000个任务的清单。所以他用AI对这些任务进行了分析——哪些可以由AI完成,哪些不能,并按照一个评分标准对它们进行评级,你知道,大约3%的任务现在可以由AI完成。所以他创建了这样一个指标,你可以用它来衡量哪些事情可以由AI完成,以及能够用AI完成这些事情的巨大通缩效应是什么——也就是说,产出可以上升。他把它叫做"幽灵GDP"。幽灵GDP。产出可以上升,但因为成本下降得如此之多,理论上GDP实际上会萎缩。所以他创建了这整套分析,以及一个全新的语言模型基准测试——不是跨2000封不同的电子邮件,而是……对吧?

主持人:

这全都是他一个人做的?

Dylan Patel:

这全都是他一个人做的。他说,兄弟,这本来需要一个200人的经济学家团队花一年时间来完成。他就像是,他完全沉迷于Claude了。他说,一切都变了。

主持人:

作为一个企业主,你如何看待从接近零到25%、并加速向某个百分比迈进的这个过程——占总支出的比例?我明白。到什么程度你会说,好吧,我需要踩刹车,谨慎考虑我们的花费。也许我们不需要花在最贵的——今天刚发布的Opus 4.7上。也许我可以退回到一个稍微便宜一点的版本。

Dylan Patel:

归根结底,我是做信息行业的,对吧?就是,你知道,我们出售分析,做咨询,创建数据集。我不明白为什么这不会在相当快的速度上被完全商品化。如果我不能持续改进我最初作为数据集出售的核心产品,那就会发生这种情况。实际上,确实是这样,你知道,现在有更多的人在尝试做同样的事情。我们让它不断变得更好、更详细。因此,它仍然有市场。但我们在2023年做事的方式与现在其他人做的方式并没有太大不同。如果我不提高标准,我就会被商品化。如果我移动得不够快,我也会失去优势。所以问题是,是的,AI会将事物商品化,就像它将软件商品化一样。那些能够快速行动、保住客户、持续提供出色服务并持续改进的人,业务不会萎缩,反而会增长得更快。那些固守现状、什么都不做的老牌企业,将会失败。所以这有点像生死存亡的问题——如果我不采用AI,别人会,而他们将会打败我。

Dylan Patel:

另一个简单的例子是能源领域。所以我们有几位能源分析师,大概一年了,我们一直在尝试建立这个能源模型。这非常复杂。能源数据服务市场大概有9亿美元的规模。所以显然是一个我试图打入的巨大市场。但是,你知道,尽管团队里有多人花了一年时间,我们真的没能打入能源数据服务业务。然后"Claude Code狂热症"击中了半导体分析公司负责数据中心、能源和工业业务的Jeremy。突然之间,在三周内,他花了很多。他每天花大约6000美元。这是一个疯狂的数字。但他抓取了美国每一座发电厂、每一条超过特定电压的输电线路,并创建了对整个美国电网的完整映射,以及大量需求来源,所有数据都来自各种公开数据源。我们展示了它,它有一个仪表盘,你可以查看和检查。你可以看到美国所有微区域的电力短缺和盈余,以及所有这些细节。

Dylan Patel:

在几周内就建成了。我们开始向一些购买我们数据中心数据集的客户展示,但也向一些能源交易员展示,他们看到后说,哇,这花了你多长时间?这真的很好。这比XYZ公司的产品还要好。然后我们深入挖掘。XYZ公司有100个人,已经在这上面工作了十年。显然,我们的产品没有那么完善、那么健壮,但在某些方面它确实更好。我要去商品化这些能源服务公司、数据服务公司——谁又会来商品化我,如果我移动得不够快的话?所以从企业主的角度来看,问题是,是的,我花了很多,但这些花费给我带来了什么?它带来了更多收入吗?

主持人:

你是否担心,在极端情况下,那些掌控资本、投资资本的人——他们通常雇用你来做你所做的事情——会说,好吧,我们也有分析师,他们对这方面非常了解。就像,我们自己来建这个。就像,如果它变得那么容易,到什么程度它就会全部被吸纳进那些投资公司——他们因为在数据或洞见上拥有最大的杠杆而最能从中获益。

Dylan Patel:

首先,任何信息服务业务,显然,我从信息中产生的价值远不如我的客户从这些信息中产生的价值。因为如果我以1美元的价格卖给你信息,你之所以愿意花1美元购买,是因为你知道这些信息能帮助你做出决策,让你赚到超过1美元的收益。因此,你有,你有套利空间,你从这些信息中赚到的钱比我从信息本身赚到的更多。

Dylan Patel:

投资基金,这些投资基金都有自己的信息服务,你知道,尤其是像那些超级顶级的,比如Jane Street和Citadel。他们对自己的数据非常精细。然而,这类机构也从我们这里购买数据,并且持续这样做,持续与我们共同成长,因为我认为就是有某种难以言说的特质,对吧?我们行动更快,我们更灵活,我们是一个专注于某一特定领域的小团队。AI基础设施,以及它带来的巨大变革,还有AI和tokenomics以及所有这些事情。我们真的看到了它的走向。所以我们行动更快,建设更快。

Dylan Patel:

我认为投资专业人士只会,你知道,是的,他们会尝试自己建一些我们做的东西,但更有可能的是,他们只会直接从我们这里购买数据。对他们来说,从我们这里购买数据,然后在此基础上构建,比自己从头开始建要便宜。但最终,有些人可能会尝试自己建。

主持人:

我感觉每次和你谈话,我一直在深入探讨的就是token的供需关系。这是我现在觉得世界上最有趣的事情。这段经历教会了你关于需求方面什么?它是否改变了你对这个等式需求侧的看法,只是直观地感受到了它本身?

Dylan Patel:

如果我们退后一步,从宏观角度来看,对吧?Anthropic已经从9亿美元的年经常性收入增长到了什么,他们现在大概在350亿到400亿,等这期节目播出时可能到400亿到450亿的年经常性收入了。他们的算力并没有增长到同等程度。如果你做计算,并假设他们没有削减研发算力——他们显然没有削减,他们发布了Mythos,他们有Opus 4.7,所以他们显然没有削减研究算力支出。所以最终,他们所做的是,即使你假设他们获得的所有增量算力都用于了推理,他们的毛利率也已经超过了72%的底线。实际上,他们获得的一些增量算力可能用于了研发。毛利率可能高于72%。需要说清楚的是,在年初,有人泄露了——是他们的某个融资方,他们的部分融资相关信息被泄露了。某人泄露了,大概30几个百分点的毛利率。这样一家企业,在哪里能实现这样的利润率增长?原理就在这里,对吧?他们的需求如此之高,他们能够削减使用限制、速率限制,所有这些东西。真正重要的是拥有一个Anthropic客户代表,与他们签订企业合同,并获得你所需要的速率限制提升,因为否则token最终是极度供不应求的,谁能付得起钱,谁就能得到。

Dylan Patel:

Anthropic也面临同样的问题,对吧?我的意思是,不是问题,这只是资本主义运作方式的现实。是的。人们在向他们发送价值400亿美元年经常性收入的token,但这些token产生的价值远远超过400亿美元。不同的企业每个token产生的价值不同,但随着我们变得越来越智能,真正重要的是获得这些最智能的token,并将它们用于某些事情上。你作为一个人,决定如何最好地利用这些token来发展业务、创造价值。因为很多人都想要token并生成token。但旧金山那家用Claude来生成他们软件产品的糟糕SaaS初创公司,不一定真的在创造大量价值,因此他们很快就会被token市场淘汰出局。

主持人:

你对此感到惊讶吗?我今天刚刚有过这样的经历——在来这里的飞机上,我在某件事上被严重限速了。我看到4.7发布了,我立刻想要的就是那一秒就能用上4.7。而且,我根本无法想象再用4.6了。既然4.7已经出来了。在过去这么多周里,我对4.6一直非常满意。太神奇了。你是否对人们如此坚持要用最贵的、最前沿的东西感到惊讶——程度之深令人咋舌。

Dylan Patel:

毫无疑问,过去一个半月里我最有趣的记忆之一,就是我和Buddy还有Leopold跪在一位Anthropic联合创始人面前,恳求他给我们访问Mythos的权限,然后假装它不存在——因为我们知道它存在。我们说,请给我们访问权限。他说,我不知道你在说什么。

主持人:

你对那个速率卡或者评估卡发布时是什么反应?

Dylan Patel:

湾区就有传言。每个人,你知道,我们有点像是知道它应该会非常好。但如果你只看基准测试,而且显然基准测试会随时间变化,Mythos可能是两年来模型能力最大的一次跃升。我认为这是一个非常重要的细节,你知道,它好到他们都不想发布——尽管他们已经向那些他们为Cyber安全做了选择性发布的人宣布了价格,token成本大概是5到10倍。他们就是不想发布它,因为他们担心对世界的影响。他们发布给我们的是较差的版本Opus 4.7。他们在模型卡里明确说了,嘿,我们实际上是有意让它在网络安全方面变得更差的。如果你读到这个,不管你是谁,如果你有足够的资本,你应该去搞一个企业级Cloud、企业级Anthropic订阅,在那里你按token付费,而不是用这些订阅制,因为那样你就不会被频繁限速,然后你必须,你需要想清楚如何将这些token用于最高价值的任务并从中赚钱。因为最终,你现在做的事情,也许一年后或两年后,这个业务实际上就是套利token,对吧?这些token非常强大,但让我们搞清楚把它们指向什么方向。然后三四年后,模型将会知道,你知道,如何使用这些token以及如何创造最大价值。你知道,你可以回顾性地看,选择任何一个基准测试。

Dylan Patel:

达到某个能力层级的成本,过去要花X,现在只需要X的百分之一或千分之一。Deep Seek为例,在GPT-4上,成本是原来的六百分之一。从那以后,GPT-4级别模型的成本进一步下降了。当然,没有人再在乎GPT-4级别的模型了。他们想要的是前沿模型,因为前沿模型让他们能够创造出具有经济价值的东西。但GPT-4级别的模型仍然可以用在一些场景中。人们在一些小型用例中使用它们。只是成本下降得太快了。真正驱动需求的不是成本,而是所有这些新的使用场景。是的。目前的4.6 Opus或4.7 Opus,对于你的这些模型。一年后,同等质量模型的花费可能大概是7万美元。我打赌它会便宜100倍。但这无关紧要,因为我将会使用一个好得多、好得多、好得多的模型,它能做好得多的事情。所以Anthropic的Mythos作为模型来说更贵,但完成同样的事情花费的token要少得多。因此,在大多数任务中,它实际上比4.6 Opus更便宜,因为它的效率要高得多。尽管每个单独的token更聪明。

主持人:

我上次见到你时,Mythos可能刚出来一天左右,或者卡刚出来,你说了一些话,大意是它实际上让你感到有点害怕,它太好了。你是什么意思?

Dylan Patel:

Anthropic在2025年的整体目标,甚至在2024年的很大一部分时间里,他们说,嘿,到2025年底,我们需要在我们的模型里实现L4级别的软件工程师。他们基本上通过4.6 Opus实现了这一目标。他们没有说的是,你知道,而且,如果你看Mythos,如果你比较基准测试,它就像是一个L6工程师。所以L4是相当新的。L6是相当有经验的。我认为Anthropic说这个模型在内部是二月份就可用了。所以在两个月内,他们从L4工程师进步到了L6工程师。

Dylan Patel:

接下来是什么?你知道,当你思考模型进展时,它只会加速。Anthropic的发布节奏压缩了,OpenAI的发布节奏也压缩了。为什么?因为这些模型,通常来说,要制造一个更好的模型,你需要几样东西,对吧?你需要惊人的算力。算力非常昂贵,它有一个时间尺度,我们,你知道,我们追踪它,它就像是,你知道,它在增长,但就像是,你知道,对于接下来的,你知道,短期内,它就像是已经板上钉钉了,就是你已经签署的那些合同。会有延误和变动,你也许能多找到一点,但总体来说是相当板上钉钉的。有那些惊人的研究人员,人们为他们支付数千万美元。

Dylan Patel:

最后,还有执行实施。历史上,这一直非常困难。如果我有一个想法,现在我必须去实施。实施是困难的。现在想法有了,实施变得非常容易了。它很贵,但非常容易。那么,如何决定实施哪些想法呢?事实证明,如果你的实施现在变得如此容易,你就可以实施更多的想法,在跑步机上越跑越快,无论是AI模型研究,还是其他什么。所以现在你的模型发布节奏从之前的六个月压缩到了两个月,或者……

Dylan Patel:

嘿,我想把美国所有的发电厂和所有输电线路都纳入进来,建模,跑回归,看看微观层面的供需关系。我也可以做到这一点。

Dylan Patel:

想法是廉价的。你知道,哪个想法有意义,哪个想法值得你在token上花费那些资本,因为执行实施已经到位了。这就是,这就是,我认为这是关键的学习。如果执行实施成本继续下降,而它们确实在下降,我们甚至还没有Mythos呢。距离Opus 4.7发布才过了几个小时。但你知道,我的团队内部对此相当兴奋。现在降临到世界上的是什么,是经济运作方式的彻底重组。过去,执行非常重要,因为执行非常困难,而想法则很廉价。现在想法既廉价又充裕,但执行变得非常容易。所以真正重要的——那些毫无价值的想法,以及那些能够证明在超级廉价的执行上花费是值得的想法。

主持人:

所以你真的感到害怕,还是说,它只是引入了一种难以应对的不确定性?

Dylan Patel:

不确定性是存在的,但我确实认为这在某种程度上引发了一些恐惧——关于社会如何重组自身?在一个世界里,你实施某件事的能力实际上并不那么重要,你为AI选择正确想法去实施的能力,以及你销售那个想法或销售AI所实施的东西的能力,才是重要的;你聚集资本的能力,才是重要的。回到之前那个观点,拥有最新的模型始终非常重要——谁将能够获得最新的模型?

Dylan Patel:

Anthropic的那个项目。我知道它不叫earwig,但我通过叫它earwig来逗Anthropic的人——glasswig,Anthropic earwig,你知道,他们只向某些公司发布Mythos用于网络安全——这只会是一种持续下去的趋势。模型的广泛部署范围将越来越窄。我知道OpenAI和Anthropic以及所有这些人都在说,我们想要让每个人都能用上出色的AI。AI非常昂贵。谁来为这万亿美元的基础设施买单?那些有钱、能用AI构建有用东西的人,而且你不希望人们蒸馏你的模型。所以你不广泛发布,而是向越来越少的客户群体发布。那些客户现在也在争夺token。除非Anthropic,你知道,他们可以把Opus的定价翻倍,我会继续付,我打赌大多数用户也会继续付。我打赌那也解决不了他们巨大的容量问题。所以问题就变成了,这个循环在哪里结束——token的使用,以及因此这些token带来的好处,在这些token之上产生的额外价值,将汇聚于越来越少的公司之中。

Dylan Patel:

我还没有Mythos。你知道,关于Mythos,顶级银行现在只把它用于网络安全。但在某个时刻,我可以设想这样一个世界:嘿,也许因为我有一个Anthropic企业合同,而且因为Anthropic的人有点喜欢我,他们愿意给我们稍微早一点的访问权限,或者稍微高一点的速率限制,或者某个模型的什么东西。我希望这就是会发生的事情。然后我的竞争对手,不管是谁,没有这个,我就能碾压他们。有些人,比如Ken Griffin和Citadel,他们人脉超广、资金雄厚,他就像是,他直接去签,你知道,谁知道呢?他去和OpenAI或Anthropic签了一份合同,大概是这样的:是的,我要获得你们模型的访问权限,我每年会购买价值100亿美元的token。所以每当你发布模型,你知道,我会花掉前100亿的token,然后其他人才能在那之后获得这个模型。那就是说,好吧,那会怎样呢?好吧,现在他将要在市场上碾压所有人。这只是一个例子。可能是网络安全,就像Anthropic担心的那样,哦,现在我可以入侵别人了。也可能是像我这样的信息服务业务,我碾压了别人。我认为,你知道,它的基础如此广泛。我们不知道这些模型能做什么,Anthropic也不知道这些模型能做什么。没有人知道这些模型能做什么。这取决于最终用户去弄清楚他们可以在哪里利用这些token,看看他们能构建什么、能想象什么——这对人类来说是极其富有成效和令人振奋的。但是,资源的集中和对它的使用会发生什么呢?

主持人:

可以这么说,目前机器人或机器人技术消耗的token相对于其他一切来说几乎是零。你怎么看——如果这像是一条可能开始棘轮式上升的第二需求曲线?就在离这里一英里之内,每天都有新的初创公司在尝试在机器人领域构建有趣的东西。所以有这个……

Dylan Patel:

有一个"纯软件奇点"的概念,就是说这个世界有。你知道,AI奇点,但只在软件领域。那么世界上其他的部分呢?世界的绝大多数是物理的。你可以看到世界围绕硬件而非软件来运转。这实际上就是为什么我认为纯软件奇点只是一个小插曲,而不是说,你知道,我们不会得到其他一切,因为一方面软件太容易了。是什么让机器人真的很难?就是给微控制器和执行器编程,控制所有这些东西,现在非常困难。

Dylan Patel:

关于AI模型,有趣的是,它们在学习上实际上是非常低效的。只是我们能够给它们提供如此大量的数据,以至于它们能够学习并在某些方面超越我们。机器人,目前,机器人模型,VLA——视觉语言动作模型,现在非常流行,可能不会是最终能够规模化的东西,因为它们在数据上效率低下,而且我们无法足够快地为它们扩充数据。将会有某种方式来大规模预训练机器人模型,就像人类在一生中看到所有这些数据一样。有趣的是,人类,我们之所以如此厉害,是因为我们的样本效率很高。一个例子,两个例子,我们就学会了。所以把这个应用到机器人上……

Dylan Patel:

所以一旦你有了这个纯软件奇点,执行实施的成本超级低廉,任何人都可以开始构建这些模型。人们可以开始构建模型,让机器人现在真正变得有用。所以我认为在未来六到十八个月内,我们将开始看到机器人领域真正的突破,实现少样本学习——也就是说,有一个预训练的机器人模型,现在有一个你雇用了或购买了或随便什么的机器人。你展示了几个例子,它就能做到了。你告诉它把这两样东西叠起来,或者你告诉它,嘿,这实际上可以完美地保持平衡,你知道,它就开始做这些事情了。

主持人:

单样本学习。

Dylan Patel:

不,相信我,我打翻了很多东西。所以我认为机器人将会,而且现在就能实现少样本学习。你知道,现在有很多公司在做机器人,用于广告或者简单任务之类的。但它会变得非常细分,比如专门用于折叠衣物的机器人,但会越来越细分,比如专门用于擦黑板的机器人。它可以是一种租赁服务,或者,你知道,会有一个模型包,你下载到你的标准机器人上,然后它就能做那件事,对吧?你按使用量付费,不管怎样,物理领域将会有一次巨大的爆炸性加速,以及相应的通缩效应。但是,而且,所以这最终将使token需求持续疯狂增长。我个人不认为token需求会放缓。

主持人:

你有没有根据 Metis 的结果以及它的构建方式学到关于这个世界的其他东西?比如说,如果你拆解规模定律的各个组成部分,你知道,比如说……

Dylan Patel:

这是一个在规模上明显大于之前模型的模型。所以是的,它是一个大得多的模型。现在,它是否是,它在什么芯片上训练的其实并不重要。重要的是规模。显然,你知道,10万块 Blackwell 相当于数十万块上一代芯片。TPU 和 Trainium 有各自不同的发布节奏,并不完全是一比一的镜像关系。但归根结底,是的,Metis 是一个规模显著更大的模型。它证明了规模定律仍然有效。关于它的一切都表明,模型的趋势线仍在延续——向模型投入更多算力会使模型变得更好。而且在整个过程中,不仅仅是向模型投入更多算力使其变得更好,我们同时也在获得这些算力效率上的提升,也就是说,你知道,实验室花费的所有这些研究算力实际上正在转化为——如果我想要某个能力水平的模型,每6个月,或者每两个月,那个成本都在大幅下降。但如果我大规模地扩展它,我同时也能获得巨大的能力飞跃。

Dylan Patel:

所以是的,这证明了这一切仍在发生。谷歌和 Anthropic 在训练侧并不是 GPU 的重度用户,但是,OpenAI,他们将开始推出新一类的模型。我认为他们正在采取一种更合理、更有原则的方式,以小步骤进行扩展。Anthropic 则真的进行了一次巨大的跃进。我们将在这一年里看到越来越好的模型。而且发布节奏只会越来越快。

主持人:

在整个对话中,我们几乎没有提到 OpenAI,这在以前会显得非常奇怪。

Dylan Patel:

所以这是有趣的地方。所有人都在说,好吧,所以 Anthropic 刚刚赢了,对吧?你知道,他们在二月份就有了 Metis。他们从来没有发布它,因为他们觉得没有必要。他们已经供不应求了。收入已经每月新增100亿美元了。然后今天你还有 Opus 4/7,这一切都发生在 OpenAI 所谓的 GPT 发布之前,你知道,媒体如 The Information 等已经报道过这件事。所以很明显,Anthropic 处于领先地位,对吧?而 OpenAI 已经完了。

Dylan Patel:

有趣的是,因为 Anthropic 在算力上有如此大的限制,他们只能以那么快的速度增长算力。从某种程度上来说,你知道,Daria 以前常常吹嘘说 OpenAI 在算力上过于激进,而 Anthropic 在扩展上更为明智,但现在 Anthropic 的态度是,我们应该,我希望我们有更多的算力。OpenAI 能够完全正常地支付账单。事实上,他们筹集了大量资金来获得额外的算力,除了他们从 Oracle、Corey、Softbank 以及所有这些人,还有微软那里购买的不负责任水平的算力之外,你知道,比如 Trainium,现在他们也从 Amazon(Anthropic)那里获得 Trainium。所以他们在算力上做了这种……疯狂的事情,而且他们知道,不,他们也知道他们需要更多。

Dylan Patel:

但有趣的是,如果你说 Opus 4/6,你知道,让我们忽略模型随时间变好这件事。让我们只看这项技术的扩散。你和我可能会在第一天就立刻使用这个模型。但其他企业需要时间,人们需要时间来学习,而那种"哦,AI 顿悟时刻"的火花并不会同时击中所有人。所以到今年年底,假设一个纯粹的 Opus 4/6 模型,整个经济体会在上面花费1000亿美元。我认为这并不是不合理的。现在的花费已经是400亿了。

主持人:

那就像是线性外推。

Dylan Patel:

这是线性外推,不是指数级的。要达到指数级,你需要更好的模型。Anthropic 没有足够的算力来做到这一点。所以,大概 OpenAI 和谷歌也会很快达到那个层级。下一个达到那个层级的人,当然,Anthropic 可能可以收取70%以上的毛利率,但如果 OpenAI 下一个达到,他们收取50%的毛利率。他们仍然能获得所有这些增量需求。而且可能他们也没有足够的算力来服务所有用户。所以当然,也许 Mythos 是一个如果世界有足够算力可以产生5000亿美元收入的模型,或者某种疯狂的数字,对这些 token 的需求如此之大,而供给又如此有限。

Dylan Patel:

算力上的限制,你知道,我们从 H100 价格飙升以及这些 GPU 的使用寿命不断延长中看到了这一点。很明显,即使是二线实验室也会把 token 卖光,更不用说一线实验室了。一线实验室会有更好的利润率,但二线实验室也会卖光,而且可能三线实验室也会接近卖光。最好的模型能够提供的经济价值增长速度,超过了我们通过基础设施实际向人们提供这些 token 的能力。所以这个差距将继续扩大,模型实验室将继续拥有不断扩张的利润率,直到硬件供应链、基础设施供应链中的人们开始说,等等,不对,我为什么不直接大幅提高我的利润率呢?

主持人:

所以可以说,我认为今天的评估,或者说你对需求侧的评估,在你自己这个具体例子——Semi Analysis 这里——是完全爆炸性的,但更广泛地说,当人们陷入你所说的 AI 心理症,当人们陷入这种体验,意识到自己能做什么,而实施难度完全消失的时候。我自己也确实感受到了,你知道,我自己的 token 消耗在短短几周内就已经绝对突破天际了。所以这感觉是一个相当准确的评估。关于需求侧,我们还遗漏了什么吗?

Dylan Patel:

如果你不使用更多的 token,你将永远无法逃脱永久底层阶级。

主持人:

请展开说说。

Dylan Patel:

所以,要么你使用更多的 token,并且产生超出使用这些 token 本身经济价值的经济价值。很多人在用无聊、懒惰的方式做这件事。哦,我猜我每天只工作1小时,而不是8小时。然后让 AI 来做我大部分的工作。那是无聊的方式。酷的方式是,我仍然每天工作8小时,然后我还额外完成8份工作,也许我能赚到5倍的钱,也许不能。你不能用一份工作来做到这一点。显然,有些人有多份工作。有些人喜欢创业,开始卖东西,在所有人都开始使用之前、在它还没有成为基本功能之前,从这个 AI 中获取那些经济价值,因为如果你不使用更多的 token 并从中产生价值,它仍然不是基本功能。并且要捕获那个价值。

Dylan Patel:

这里有三个不同的问题。使用更多的 token,从这些 token 中产生价值,以及从你用这些 token 创造的价值中捕获价值。如果你不做这三件事,你将永远无法逃脱永久底层阶级,也就是说,随着模型能力继续飙升,以及资源集中化可能发生的情况。

主持人:

好的,让我们来谈谈供给侧。发生了什么?你会如何描述前沿的变化,或者在供应整个堆栈方面,随着需求曲线爆炸性增长,服务所有这些 token 所需的一切正在发生什么变化?

Dylan Patel:

随着需求飙升,供给侧的一切价格都在上涨,无论是 GPU,它们的价格都在上涨。此外,它们的使用寿命也在延长。

主持人:

H100 的价格看起来是这样的(向上)?

Dylan Patel:

是的,正是。有些人认为 GPU 的使用寿命不到5年。完全是无稽之谈。现在有些集群,3到4年前的 Hopper 集群正在续签3到4年的合同。有些 A100 集群正在续签几年的合同。所以使用寿命显然不是5年。也许甚至是7到8年,可以这么说。我们还不知道。等 Hopper 到那个时候我们再看,但显然不是5年。所以使用寿命在延长,而且续签时的价格也在上涨。所以实际上,一个集群的毛利率不是35%,而是超过了这个数字。所以云层的利润率在扩张。硬件层的利润率非常健康,你知道,Nvidia 仍然收取75%或其他某个百分比的毛利率。当我们向下移动堆栈时,内存,显然那里的利润率已经飙升。像光学和逻辑这样的地方,有大量预付款,利润率正在缓慢增长。更多的是那些像 Nvidia 一样制造芯片的公司。

Dylan Patel:

支付巨额预付款。所以它影响了资本成本或现金流的时机,即使毛利率没有提高,投资资本回报率也在上升。你在整个供应链中都能看到这一点。你看到 ASML 已经完全卖光了,他们需要 Carl Zeiss(蔡司)更快地扩张。在整个链条上,每个人要么卖光了利润率在上升,要么在收取预付款,这提高了投资资本回报率,因为投资资本更低了。所以这就像是贯穿任何部分的一致趋势。甚至像,你知道,一块 PCB,制造 PCB 需要铜箔,那种铜箔已经卖光了,人们正在为它支付预付款。就像任何有点生命力的东西,只要它卖光了,人们就会争先恐后地获取更多的增量供应,并争夺未来几年的供应。

主持人:

你认为最重要的瓶颈是什么?通常在经济历史上,当出现这种需求时,供给会重新调整并迅速增长以满足需求。在这个时刻,供给似乎几乎不可能跟上。你知道,这是著名的"最后的话",历史上每次短缺之后都会出现过剩。但在整个供给侧,哪些瓶颈对你来说是最有趣的?

Dylan Patel:

供应链通常反应非常快。一个独特的地方是,我们的供应链现在比以往任何时候都更加复杂,我们正在构建的东西也比以往任何时候都更加复杂。因此,交货期更长了。并不是说我们在其他行业没有见过18个月的长交货期,只是建立增量供应以前不需要数年时间。

Dylan Patel:

内存就是这种情况,对吧?内存每年只能以低两位数的百分比增长产能,对吧?每年20%、30%,NAND 甚至更低,DRAM 稍微高一点,即使需求信号非常强烈。

Dylan Patel:

在2025年底,内存公司立即开始有所反应。除了他们决定增加的那些增量产能,加上典型的20到30%,你知道,他们可以稍微拉伸一下,但真正的增量供应要到28年才能到来,这是非常独特的一件事。即使他们想尽快建设,最早也要到2027年底、2028年初才能到来。所以结果是内存价格,你知道,已经飞涨了。你猜怎么着?它们还会再翻倍和三倍,至少 DRAM 是这样,特别是有些人说,哦,内存的故事被过度渲染了。大家都明白了。然后就是,不,你不明白。DRAM 从现在起还会翻倍或三倍,仍然是这样,因为这就是需要的产能量,他们必须从其他地方挪用产能。而在资本主义经济中,从其他地方挪用产能的唯一方法是通过更高的定价来摧毁需求。我们不是在这里实行配给制。所以最终,这就是将要发生的事情。所以利润率继续上升。

Dylan Patel:

我认为逻辑芯片也有巨大的产能问题。台积电刚刚公布了他们的财报,他们继续增加资本支出。最终,你知道,他们需要相当长的时间来建造晶圆厂。他们正在竭尽全力从每一个晶圆厂中挤出每一点产出。但最终,他们没有快速提价,因为他们是好人。这看起来像是,你知道,个位数的价格涨幅,而不是像内存公司那样三位数的价格涨幅。所以你最终会有这样一个市场,是的,台积电是一家伟大的公司,但他们真的会提取所有价值吗?我提到了铜箔、PCB 用的玻璃纤维、激光器。这些都是众所周知的利基供应链,但它们非常紧张。而最终在上游,半导体晶圆制造设备供应链是一个我仍然认为,它已经上涨了很多,但仍然非常被低估的领域。

Dylan Patel:

台积电今年的资本支出,他们说是560亿,我们自1月份以来得到的数字是574亿。我们可能会稍微上调,因为我们看到了一些他们可以获得增量资本支出的方式。但人们没有关注的是,这对明年意味着什么,对后年意味着什么?事实证明,三年后,台积电将在资本支出上花费1000亿美元。也许两年后,对吧?可能是2028年。说真的,他们可能在2028年花费1000亿美元的资本支出,而人们根本无法想象这一点。

Dylan Patel:

但这对他们的下游供应链意味着什么?你知道,像泛林研究、应用材料、ASML 这样的公司,或者更下游的供应链,比如 MKSI 和所有这些其他公司。鞭打效应会越来越猛烈。而最终这就是短缺。如果,你知道,台积电想在2028年花费1000亿美元,这是一个真实的可能性。我认为人们会觉得这太疯狂了,但这是一个真实的可能性。

主持人:

那么芯片生态系统中其他GPU完全占主导地位的领域呢?比如CPU、ASIC,或者那些既是机遇又是瓶颈的东西,不仅仅是英伟达GPU的主导地位。

Dylan Patel:

是的,我的意思是,ASIC显然正在起飞,但我会稍微转移一下话题,从AI芯片聊到这些其他的东西。我们做了一个关于FPGA的项目,结果发现每个下一代机架、AI机架里有120个FPGA。然后,那些FPGA、CPU,所有这些强化学习环境,加上你我正在生成的那些垃圾代码,现在都跑在某个Versal实例或者某个AWS实例,或者我们启动的某个存储桶上。所有这些都需要CPU。所以CPU完全供不应求,需求正在急剧攀升。

主持人:

帮大家理解一下CPU在其中扮演的角色。

Dylan Patel:

是的,所以你需要大量CPU主要有两个原因。第一个是当你做强化学习的时候,CPU非常关键。与此同等重要的是:以前你会把所有互联网上的数据扔进模型去训练,它输出一些东西。现在你训练完全世界的互联网,你把所有互联网数据放进模型,然后你把它放进这个环境里。这个环境就像是:嘿,模型,试试这个。然后它尝试各种各样的东西。最终,有一个环境来评分,判断它尝试的东西是否成功,并给它打分。这些环境可以是任何东西。

Dylan Patel:

可以是:嘿,检查一下文本输出的格式是否正确。结构化输出可以是非常简单的事情,也可以是非常复杂的事情。人们开始涉足非常复杂的事情,对吧?

Dylan Patel:

比如:嘿,我要你打开这个文件,修改它、编辑它、更新它,然后提交到这个网站。我要你打开西门子的这个物理仿真软件,编辑这个CAD模型——所以这些环境可以变得越来越复杂。而这些环境运行在CPU上,它们不运行在GPU上,也不运行在ASIC上。ASIC运行的是模型——那个从环境中接收输入数据、将其传入模型、模型生成各种不同轨迹输出的模型,也就是我认为它可以在不同情况下解决问题的各种方式。这些轨迹被评分或打分,成功的那些你用来训练,然后更新、反复迭代。所以CPU在这方面非常有用。然后,一旦你拥有了这些优秀的模型并开始部署它们,这些模型在生成代码,在生成有用的输出。这些有用的输出,并不是直接从GPU传到人类大脑的。它从GPU或ASIC传到某个你部署在某处的应用程序,而那个应用程序实际上就是跑在CPU上的。所以这是另一个需求量很大的领域,而且在很大程度上已经供不应求。

主持人:

当你持续评估并努力成为全球在供需走势方面信息最充分的人时,有哪些是你希望自己能了解的?也就是说,让你意识到自己还不知道的那些东西。

Dylan Patel:

我认为对我们以及对所有人来说最难的领域是理解"Token经济学",也就是Token的经济学。我认为我们对运行基础设施的成本、Token的成本、模型的成本、这些实验室的利润率有着非常非常深刻的洞察,但使用量和采用情况才是真正难以持续建模的,你懂的,对吧?

Dylan Patel:

我们有这些……比如我们在一月份有过疯狂的估算,在二月份也有疯狂的估算。Anthropic 把它们全都打破了。我们该如何校准这个模型?二月份的数据来源是什么?我们对三月份有疯狂的假设,然后他们又打破了,每个人都看到了100亿这个数字,然后都在想,什么,他们怎么增加了100亿的收入?谁在使用所有这些Token?他们为什么使用它们?他们用这些Token在构建什么?更重要的是,他们用这些Token构建的东西,实际上是如何扩散到经济中去的?这又产生了什么价值?因为这实际上并不是你能在任何GDP统计数据中捕捉到的东西,对吧?我使用的所有Token的价值都被转化成了更好的信息,然后我以相对低于人们过去出售信息的价格折扣出售这些信息,因此,这些信息现在正在整个经济中传播,人们正在做出更好的投资决策,或者更好的竞争决策——如果他们是半导体公司、数据中心公司或超大规模云服务商的话。

Dylan Patel:

那么,这一切的价值是多少,这对经济做了什么?从每一个主观指标来看,这显然是惊人的。但那"幽灵GDP"在哪里?"幽灵GDP"是什么?我们如何追踪真实的经济增加值?因为GDP指标并不准确,你知道,如果你要说Dylan Battelle创造的GDP是多少,与我认为正在创造的价值相比,它是微不足道的。所以归根结底。

Dylan Patel:

这些Token所创造的价值是什么——不是基于简单的,你知道,连锁效应是什么,对吧?所有这些东西正在做的事情的连锁效应是什么?我认为这才是真正难以衡量的问题和挑战。我认为我们在供给侧有着非常出色的解读。我们在很多需求侧信号方面也有着非常出色的解读,但难以量化和衡量的,是这些Token正在产生的价值。

主持人:

我希望我们每三个月都能有这样一次机会,因为这变化得太快了。你认为接下来会发生什么?比如三个月后我再来,或者我们再次在旧金山相聚,你期待会发生什么?

Dylan Patel:

大规模抗议。真的吗?是的,我认为会有针对Anthropic的大规模抗议。

主持人:

最终会演变成AI实验的对立面。

Dylan Patel:

人们讨厌AI,AI的受欢迎程度低于冰淇淋,低于政客。不知道皮尤是怎么做这个调查的,但显然AI的受欢迎程度低于政客。你知道,随着Anthropic增加如此多的收入,这将开始在下游引发商业变化。人们会越来越害怕AI。他们会开始把越来越多自己的问题,以及那些全球性的、长期以来根深蒂固的问题,归咎于AI。这些问题会浮出水面并被归咎于AI。可能某些政客或某些社交媒体人士,某个网红,将能够开始利用AI来对付人们。你看看那些新闻文章的评论,Sam Paul Altman在大约两周内两次遭人向他家扔燃烧 弹。评论里的人们都在欢呼,而这仅仅是个开始。所以我认为三个月内我们会看到针对AI的大规模抗议。

主持人:

对此的制衡力量是什么?AI行业应该如何化解这一局面?

Dylan Patel:

首先,Sam Altman和Dario必须停止接受采访。他们太缺乏个人魅力了。我不知道他们在干什么。他们做的每一次采访都像是,好吧,普通人会更加讨厌你。比如Sam上塔克·卡尔森的节目,可能让所有共和党人都讨厌OpenAI。Dario也一样。他们完全没有魅力。我认为这是前两点。他们需要开始展示AI能做的那些振奋人心的事情。第三,他们需要停止不断谈论AI的能力将如何彻底改变整个世界,因为这样人们就会对这种能力产生恐惧,因为他们与之毫无联系。

主持人:

不知道如何使用它。

Dylan Patel:

是的,也没有任何联系。就像普通人不认识Anthropic的员工。普通人不认识OpenAI的员工。普通人不知道这些人是谁,他们的目标是什么,他们只是把这些人视为某种……像鬼鬼祟祟的小团体。就这5000个人的公司,他们要改变世界,自动化所有工作,摧毁社会。这就是他们的看法。而且,作为资助建造所有这些数据中心和发电厂的人,这些设施将污染世界,对吧?他们并不完全理解正在发生的事情。你知道,他们必须停止谈论未来将要发生的事情,而只谈论当下,谈论AI如何令人振奋。我认为这需要一次重大的重组和品牌重塑。这件事必须要做。

主持人:

我很喜欢和你一起做这件事。感谢你的时间。太棒了。

Dylan Patel:

谢谢。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10