黄仁勋最新对话实录 | 十年内Token生成成本或将降低10亿倍

数字开物
Yesterday

1月8日,英伟达创始人兼 CEO 黄仁勋 接受了海外播客 No Priors 的深度访谈。本次对话发生在 AI 产业从“规模扩张”转向“逻辑推理”的关键节点,全方位探讨了 Scaling Law 的本质、AI 工厂的商业模式、对基础设施的重定义、以及具身智能与数字生物学的突破路径、对“AI 泡沫论”的反击等话题。

黄仁勋指出,AI 已彻底脱离传统“预录制软件(如 Excel)”的范畴,进化为持续消耗能源并实时产出智能 Token 的“AI 工厂”。黄仁勋强调,这种范式转移意味着在摩尔定律失效的背景下,计算的产出效率已不再依赖晶体管的堆叠,而是转向算法、架构与硬件的“三重红利”。他预判,未来十年 Token 生成成本将实现 10 亿倍的爆发式下降,这将驱动全球价值 2 万亿美元的研发预算从传统的“湿实验室”向超级计算机集群进行结构性迁移。

针对 AI 失业论,黄仁勋提出了“任务与目标”剥离的视角,他以放射科医生为例指出,AI 虽然承担了“研究扫描图”的任务,却强化了“诊断疾病”的终极目标,这种效率提升反而会通过释放社会对高质量医疗的潜在需求,导致相关岗位数量不降反增。

黄仁勋指出,AI 基础设施的巨大电力缺口已成为全球气候创新最强有力的引擎。他认为,正是由于 AI 产业对算力的极致渴求,才倒逼了核能、小型模块化反应堆(SMR)及新型电池技术的跨越式发展,AI 将成为可持续能源有史以来最强大的驱动力。此外,他认为未来5年是“垂直化爆发之年”,指出行业已成功跨越“幻觉”难题,AI 正在法律、医疗及具身智能领域实现 99.9999% 的工业级可靠性。

01、行业成功解决幻觉难题,高价值推理 Token 已实现商业盈利

2025 年作为 AI 风暴中心的亲历者,回顾这一年,哪些变化最令你惊讶?特别是在解决 AI 曾广受诟病的幻觉和生成无意义内容方面,行业取得了哪些实质性进展?这种飞跃如何体现在医疗、法律等垂直领域的实际应用中?目前推理 Token 的生成率和盈利表现如何?

黄仁勋:有些事情是在预料之中的,例如 Scaling Law 的持续生效并没有让我感到惊讶,技术的稳步演进也在意料之中。令我欣慰的是事实置根(Grounding)能力的提升、推理能力的进步,以及所有模型与搜索功能的深度整合。现在模型前端普遍引入了路由器,能根据答案的置信度自主决定是否进行深入研究,这从整体上提高了回答的质量和准确性。我对此深感自豪,整个行业成功解决了 AI 最受质疑的难题之一,即幻觉和生成无意义内容的问题。今年,从语言、视觉到机器人和自动驾驶,各领域在推理应用和事实置根方面都实现了飞跃。我为全行业的努力感到骄傲,令我略感惊讶的是,推理 Token 的生成率增长如此之快,似乎多个指数级增长在同时发生。更令人欣喜的是,这些 Token 现在已经能产生利润。OpenEvidence 的毛利率达到了 90%,这些都是极具价值且盈利丰厚的 Token。Cursor 的利润非常可观,Claude、OpenAI 的企业端应用利润表现也都很好。看到我们生成的 Token 质量足够好、价值足够高,以至于客户愿意为此支付高昂费用,这真的很棒。

(关于 AI 软件本质)短期内最关键的一点是,AI 虽然是软件,但它不是传统的预录制软件。像 Excel 是由数百名工程师编写、编译并分发多年的成品。而 AI 会结合你的提问背景和全球实时信息,每一次都是实时生成。就像人类智能一样,虽然对话基于事实和知识,但每个字都是当下生成的。AI 的独特之处在于它需要计算机实时生成这些 Token。我称这些设施为 AI 工厂,因为它们在源源不断地生产供全球使用的 Token。

02、AI驱动了芯片、超级计算机和智能工厂三大产业链的大规模动工

你提出的“AI 工厂”概念如何重塑我们对基础设施的理解?为了支撑这种前所未有的实时计算需求,目前在产业端和劳动力市场正在发生哪些结构性变化?

黄仁勋:AI 也是一种基础设施,因为它影响着每个应用、每家公司、每个行业乃至每个国家,就像能源和互联网一样。为了满足这种前所未有的计算需求,三个全新的产业正在兴起:第一,我们需要更多的芯片工厂,像 TSMC 和 SK Hynix 正在大规模扩建。第二,我们需要新型计算机工厂,生产像 Grace Blackwell 这种全新的超级计算机,它的整个机架就是一个 GPU。第三,我们需要大规模的 AI 工厂。这三类工厂目前正在美国范围内大规模动工。

这创造了对建筑工人、管工、电工、技术员和网络工程师的巨大需求,这种熟练劳动力缺口是惊人的。我很高兴看到电工的薪水翻倍,他们现在像商务人士一样到处出差去支援建设。这三大产业正在创造海量的就业岗位。

03、生产力提升释放了社会对高质量服务的潜在需求

AI 社区中常存在一种末日论调,认为技术会取代人类工作。但历史证明技术变革往往在改变职能的同时创造更多岗位,结合核医学、会计或护理等行业的现状,请问该如何区分工作的“任务”与“目标”?如何理解 AI 在解决全球劳动力短缺(如老龄化、司机短缺)中的角色?

黄仁勋:我最喜欢 Geoff Hinton 的例子,他在大约五到七年前预测 AI 将在五年内彻底改变放射科并取代医生。他的前半句是对的,现在 100% 的放射科应用都由 AI 驱动。但在八年后的今天,放射科医生的数量反而增加了。

这就是工作的任务与目标之间的区别。放射科医生的任务是研究扫描图,但目标是诊断疾病。正因为 AI 能帮他们更深、更准地研究更多片子,他们能要求更多扫描并进行科研,从而更好地诊断疾病。医院效率更高,病人更多,收入随之增加,进而需要聘用更多的医生。你工作目标是什么,你在工作中执行的任务又是什么,这两者需要区分。我每天大部分时间在打字,那是我的任务,但打字显然不是我的目标。AI 帮我自动完成打字任务,并没有让我清闲下来,反而让我能处理更多工作,变得更忙了。

(关于企业效率)如果 NVIDIA 的生产力提高了,我们不会裁员,而是会去做更多创新性的事情。我们越有生产力,能探索的想法就越多,公司增长就快,利润也随之增加,从而支持我们追求更多愿景。如果世界上的问题是有限且已解决的,提高生产力才会缩减经济规模,但现实显然相反。关于机器人抢走工作的担忧,现实是我们面临严重的工厂劳动力短缺。大部分公司很难留住工人,全球卡车司机也严重短缺,因为很少有人愿意长年累月四处奔波。机器人将填补由于人口老龄化带来的日益严峻的劳动力缺口。自动化是在解决劳动力不足问题。而且大家别忘了,有了汽车,就诞生了机械维修行业。如果世界上有 10 亿台机器人,那将催生全球最大的维修产业。AI 行业本身就在创造一场就业热潮。

04、God AI在短期内是伪命题,开源是全球企业创新的氧气

面对 AI 实现的复杂架构,你如何看待开源在其中的角色?现在有一种叙事认为全能模型应由垂直巨头垄断,这种“God AI”的观点是否客观?同时,一些 CEO 向政府游说加强监管,这是否属于“监管俘获”以扼杀初创公司的竞争?

黄仁勋:我们可以把 AI 的实现看作一个五层蛋糕架构:底层是能源;第二层是芯片;第三层是基础设施;第四层是模型;最顶层是应用。领先的实验室选择闭源无可厚非,那是投资回报考量。但如果没有开源,初创公司和各行各业的传统企业都将举步维艰。那些拥有百年历史的工业或医疗企业需要基于预训练模型,根据专业领域进行微调,开源是他们创新的氧气。我们绝不能破坏这个创新的飞轮。

(关于 God AI)或许未来某天会出现所谓的 God AI,但那一天的到来可能需要银河系级别的时间尺度。谈论从现状直接跃迁到 God AI 并没有实际意义,目前没有任何公司或研究人员具备创造它的能力。要让 AI 极度精通语言、基因、分子及物理规律,这种 God AI 现阶段根本不存在。认为单一巨头能垄断它的想法过于极端且毫无益处。如果 God AI 真的无所不能,政府制定政策的意义又何在?我们应该回归务实。

(关于监管俘获)一些德高望重的人描绘的末日叙事极其有害,科幻小说很有趣,但这些论调对政府毫无帮助。当公司游说政府去监管其他公司或行业时,这种行为显然存在利益冲突。我无法揣测其内心,但监管俘获确实令人担忧。

05、AI性价比每十年提升百万倍,未来成本将降低 10 亿倍

目前 GPT-4 级模型的 Token 成本已大幅下降,这种性价比的提升源于何处?随着 Scaling Law 推动模型规模持续扩大,我们该如何平衡训练成本与推理成本?你对未来十年的 Token 经济学有何预判?

黄仁勋:Andrej Karpathy 曾估计构建第一个 ChatGPT 的成本,现在同样的模型在个人电脑上一个周末就能完成。我们提升 AI 性价比的速度是惊人的。每一代产品的架构都在改进,从 Volta 到 Ampere 再到 Blackwell,晶体管数量和容量都在增加。摩尔定律是每 18 个月翻倍、十年百倍,而在 AI 领域,十年可能实现百万倍的增长。

(关于成本预判)结合硬件、算法和模型的优化,如果十年内将 Token 生成成本降低 10 亿倍,我一点都不会感到惊讶。这就是 AI 的 Token 经济学。

(关于 MoE 的红利)虽然人们追求更大规模,但 MOE(混合专家模型)让计算负担并不会同比例增加。我们正获得硬件、算法和架构的三重红利。这种跨团队的相互学习是行业进步的最大动力。随着重心转向后训练,初创公司将利用开源基础在垂直领域做到极致。

06、灵活架构与算法演进

在 ASIC 层出不穷的当下,英伟达为何始终坚持可编程架构?面对注意力机制、混合状态空间模型(Hybrid SSM)等算法的快速迭代,这种灵活性如何转化为成本优势?另外,英伟达内部是如何利用 AI 工具提升工程效率的?

黄仁勋:专用 ASIC 在特定任务中表现出色,但 Transformer 变体演进极快。我们的 Nemotron 采用了混合状态空间模型架构。坚持可编程架构的核心在于,摩尔定律失效后,每年数百倍的跨越完全依赖算法创新。因此,能支持任何算法的架构才是最优解。

(关于兼容性与 MoE)这种灵活性保护了庞大的安装基数。FlashAttention、SSM、扩散模型等新技术,甚至 CNN 和 LSTM 都能在英伟达平台上无缝运行。凭借最新的 NVLink 72 技术,我们在生成 MoE Token 的成本上已做到全球最低。此前业内低估了 MoE 的推理难度,在推理端生成 Token 极其困难,而我们的架构解决了这一点。

(关于内部 AI 实践)英伟达内部已经全面普及了 Cursor,每位工程师都在使用。我们现在每周一都有新员工入职,招聘规模惊人。如果工程师的目的是解决问题,而不仅仅是写代码这种任务,那么 AI 将释放他们去探索更多未知,这对公司价值巨大。

07、蛋白质生成进入飞跃期,推理能力将解决机器人的安全性难题

展望 2026 年,多模态与超长上下文将带来哪些行业拐点?特别是在数字生物学领域,蛋白质理解与生成技术达到了什么水平?同时,具备推理能力的端到端模型将如何改变自动驾驶与具身智能的安全性?

黄仁勋:推理能力的提升将使汽车从简单的感知进化为推理驾驶,能够拆解从未见过的场景。英伟达的自动驾驶栈安全性能目前全球第一。在多模态视觉、语言-动作模型与推理系统的协同下,人形机器人将迎来突破。

(关于数字生物学)我们将迎来数字生物学的 ChatGPT 时刻。我们已经掌握了蛋白质理解技术,最近开源了 LatteProtina 模型。已有不少公司尝试端到端分子设计,涵盖化学理解与蛋白质构象解析。以前研发重心在湿实验室,现在正向超级计算机迁移。

(关于机器人安全性)我对机器人更乐观。虽然人形机器人在机械电子方面仍有挑战,比如 300 磅的机器人摔倒与儿童互动的安全风险,但这些终将解决。AI 会根据需求驱动不同的工具,无论是工业臂还是重型机械。在工业领域,必须达到 99.9999% 的可靠性,核心技术解决前 99%,剩下的精度则由垂直行业巨头配合底层技术打磨完成。

08、AI需求正驱动核能与 SMR 技术的跨越式发展

面对 2025 年日益严峻的能源供应挑战,你如何看待现有电力储备对 AI 爆发的约束?如何评价政策转变对工业革命的影响?同时,AI 基础设施建设带来的巨大需求,是否正在反过来驱动美国在新型电池、太阳能浓缩设备以及小型模块化反应堆(SMR)等领域的创新?

黄仁勋:政府提出的能源政策转向非常关键,必须承认,如果不是因为国家对能源增长情绪的彻底转变,我们恐怕已经把这场工业革命拱手让人。即便如此,电力短缺依然是当前最现实的约束。没有能源,新工业就无从谈起。事实上,我们已经处于能源匮乏状态近十年了。增长离不开能源,我们需要所有形式的能源,包括天然气、更多的并网能源以及用户侧能源。我们还需要核能,单靠风能和太阳能无法满足工业级需求。虽然我们会利用一切可用资源,但在未来十年内,天然气仍将是支撑增长的唯一现实路径。

(关于气候创新)这非常有意思,AI 产业的崛起正在反过来推动可持续能源产业。由于市场预见到了巨大的需求,即便短期内除了大规模天然气外没有更实际的方案,它依然成为了气候创新的引擎。需求才是产业发展的终极动力。当历史重写时,AI 可能会被证明是可持续能源有史以来最强大的驱动力。我们必须在现实中寻找平衡。如果 90% 的声音都在宣扬悲观情绪,就会吓跑那些本可以利用 AI 让社会更安全的投资。我对未来的技术演进充满期待。

09、为什么说“AI泡沫论”过于肤浅

业界目前非常关注 AI 是否处于泡沫之中,特别是有人引用 MIT 的研究称大多数企业部署收效甚微。如果回归计算的第一性原理,NVIDIA 的加速计算范式如何超越 AI 聊天机器人的范畴?如何看待 OpenAI 等应用层公司对算力“产能”的需求,以及量化金融和生物制药研发预算向 AI 基础设施的结构性迁移?

黄仁勋:理解这个问题需要回归计算的第一性原理。NVIDIA 定义了加速计算,这一范式涵盖了计算机图形学、SQL 数据处理、分子动力学和量子化学,这些领域与 AI 并不重叠。核心动态是计算基础正从通用计算向加速计算转型,因为摩尔定律已基本终结。你不能再像以前那样把 CPU 用于一切,它的产出效率和通缩效应已经不足以支撑现代需求。即便今天所有的聊天机器人都不存在,NVIDIA 依然会是一家数千亿美元的公司,因为计算的底层逻辑已经发生了根本性转移。

(关于产能与需求)针对 AI 泡沫的质疑,外界习惯仅通过 OpenAI 的收入判断。但事实是,如果他们现在的算力产能翻倍,收入就会翻倍。在我们的世界里这叫产能需求,在他们的世界里这就是工厂需求。没有工厂产能,他们就无法生成 Token,也就无法转化为业务增长。

(关于研发预算迁移)AI 的内涵远比聊天机器人丰富。我们的自动驾驶业务已接近百亿规模,我们在数字生物学、金融服务等领域的 AI 工作同样进展神速。尤其在量化交易领域,现在完全依靠 AI 发掘特征。放眼全球 100 万亿美元的 GDP,每年约有 2% 投入研发。五年前,顶级药企的研发重心都在湿实验室里,而今天他们都在建造超级计算机。这 2 万亿美元的研发预算,正经历从旧模式向 AI 基础设施模式的结构性迁移。没有任何一个科学家会说自己的算力够了。单纯以应用层初期收入来定义基础设施投入为泡沫,是极其肤浅的。

10、垂直化爆发与未来五年展望

想要观察全球创新,为什么应该关注初创公司而非大型企业?在医疗、保险等保守行业,像 OpenEvidence 和 Abridge 这种工具是如何通过解决“任务”来服务“工作目的”的?当我们思考未来五年时,AI 作为“多层蛋糕”架构将如何改变我们的研究模式(如阅读 Arxiv 论文)?

黄仁勋:想要发现风向标,不应该去大企业,因为大企业通常是新技术最慢的采用者。你应该去和那三、四万家活跃的初创公司交流。医疗行业是所有行业中最保守的,但正因为他们极度关注答案准确性,像 OpenEvidence 这种能产出高质量信息的研究工具才显得弥足珍贵。医生们不需要繁杂的搜索,他们需要直接的答案。Abridge 也是极佳案例,它让医生从枯燥的文书工作中解脱。

(关于认知极限与 AI 协作)从需求看,很多职位的工作量已超人类极限。以前我们必须亲自读 Arxiv 论文,我现在不再亲力亲为了。我直接将论文加载进 AI,让它学习并进行多轮提炼。我们的目标是获取答案并变得更聪明,而 AI 正是利器。

(关于未来五年展望)AI 就像一个多层蛋糕,它在各行各业展现出极高的多样性。当我们思考如何获胜时,不应仅仅追求某一家公司的胜出,而应该是全方位、跨领域的全面领先。工厂依赖能源,没有能源就没有工厂,没有工厂就没有 AI。整个行业在过去一年取得了巨大的跨越。Scaling Law 的持续生效让我们确信投入更多算力就能获得更高智能。一个领域的创新正以前所未有的速度渗透到所有其他行业。接下来的五年将是非凡的,明年更是不可思议的一年。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10