本文作者Robyn Mak为路透热点透视专栏作家,以下内容仅代表其个人观点
路透香港6月3日 - 如果有一个趋势足以让全球企业的财务部门感到恐惧,那就是“tokenmaxxing”(将token用量拉到极限)。从亚马逊AMZN.O 到 Meta Platforms META.O,各家公司都在积极推动员工拥抱人工智能,从而带动了对模型和应用的需求激增。这一转变使得原本可预测的IT预算变得极其不稳定、难以合理解释。一场调整正在逼近。
目前企业正陷入一场竞赛,力图推动对“token”(即大型语言模型处理和生成的文本或数据单位)的广泛使用。像编程代理这样的工具——它们通常在后台运行,并与模型进行持续频繁的交互——会消耗大量token。这促使从ChatGPT的开发者OpenAI到微软MSFT.O旗下的GitHub等AI公司,在月度或年度订阅费用之外,引入按使用量收费的模式。
额外的成本给首席财务官们带来了新的难题。Gartner的调查发现,受访的高管中有四分之三预计今年科技预算将增加,近一半的人估计增幅会达到两位数百分比。牛津经济研究院(Oxford Economics)估算,其中相当一部分将用于人工智能领域——到2035年,AI支出将占企业整体技术支出的五分之一以上,而如今这一比例还不到4%。
图:全球在AI代理和模型方面的支出正在上升
这对OpenAI和Anthropic来说是个好消息,两家公司都在为重磅首次公开募股(IPO)做准备。根据Gartner的数据,到2027年,全球在模型和AI软件(包括两家公司推出的聊天机器人、助手和代理)上的支出有望超过6800亿美元,是去年的两倍多。
不过,这种挥霍式的支出对客户来说似乎难以长期维持。据金融时报报道,亚马逊员工在使用AI工具处理一些其实没有必要的任务时,导致额外成本增加,从而人为推高了token的消耗,一名高管因此恳请道:“请不要为了用AI而用AI”。
对高管来说,挑战主要有两个方面。首先,与相对稳定的软件订阅不同,基于使用量计费的token费用难以跟踪和预测。优步的首席技术官在4月承认,公司已经超出了全年AI预算;据The Verge报道,就连微软也因成本飙升而限制工程师使用Claude Code的权限。
许多公司都面临同样的困境:一项调查显示,71%的企业去年都出现了AI成本超支。与此同时,数据管理、基础设施、网络费用以及其他支出也在不断攀升,使得财务团队对AI支出的建模变得更加复杂。
此外,这些技术投资的回报仍然不明朗。许多公司仍处于AI试验阶段,但微软首席执行官纳德拉最近警告称,“IT预算将不得不根据业务成果进行重塑”。这些成果将包括营收增长、持久的生产率和效率提升,以及成本削减。然而,早期的零散数据却令人深感忧虑:IBM去年对全球2000名首席执行官的调查发现,过去几年中,只有四分之一的AI项目实现了预期的投资回报;波士顿咨询的另一项调查显示,60%的企业没有从AI中产生任何实质性价值。随着在某些任务中运行AI代理的每日token成本超过相当的人力成本,高管们将不得不收紧支出,并转向实现可持续收益。
图:在某些任务中,人力成本比AI代理更低
所有这些都表明,企业在不久的将来将加强财务纪律。其中一个选择是用更便宜的模型来完成较不复杂的任务,比如中国阿里巴巴9988.HK及其他公司推出的开源模型。这将需要对预算进行监控、设限和配置。这种转变可能类似于企业在从本地服务器全面转向远程算力之后,逐步学会控制云计算开支的过程。就在2022年,还有估计认为云计算支出中有32%被浪费;而到2025年,这一比例已降至27%。不过有趣的是,由于AI的推动,云资源浪费如今又开始上升——这是五年来的首次增加。
图:企业称云计算支出中的浪费正在上升
不过,token成本的未来仍然是一个巨大的未知数。算力供给紧张,尤其是在美国,数据中心建设周期漫长、电力受限以及其他障碍重重,这意味着需求可能会持续超过供给。
与此同时,芯片、软件和硬件的进步意味着推理成本将持续下降。例如,在具备AI能力的台式机、笔记本电脑和手机上运行开源模型,已经比依赖基于云的专有模型便宜得多。此外,在充裕融资的支持下,一些AI初创公司已经对token成本进行了补贴。不过,从长期来看,这种模式似乎难以持续。
因此,一场AI成本紧缩似乎不可避免。对OpenAI及其竞争对手而言,好的一面在于,即便token价格下降、用户开始控制成本,这也不一定会以牺牲AI的采用为代价。云计算的发展路径表明,一个更可持续的商业模式是可以形成的。即便如此,控制AI支出的竞赛才刚刚开始。(完)
Global spending on AI agents and models is rising https://www.reuters.com/graphics/BRV-BRV/gkplknadnvb/chart.png
Humans are cheaper than AI agents for some tasks https://www.reuters.com/graphics/BRV-BRV/zdpxgmkxyvx/chart.png
Companies are reporting higher levels of wasted cloud spending https://www.reuters.com/graphics/BRV-BRV/egvberqobpq/chart.png
(编审 张荻)
((patrick.zhang@thomsonreuters.com;))