人工智能领军企业OpenAI近日公布了其最新语音模型Gpt-Realtime-2的详细计价标准。根据官网披露的信息,该模型对音频输入令牌的收费标准为每100万个令牌32美元,而音频输出令牌的定价则为每100万个64美元。
这一差异化定价策略凸显了音频处理过程中输出生成环节更高的计算资源消耗。与文本模型相比,音频模型需要更复杂的声学建模和信号处理技术,特别是在实时交互场景下对延迟控制有着严苛要求。
行业观察人士指出,此次定价体系为开发者评估语音AI应用成本提供了明确参考,也将影响未来语音交互产品的商业化路径。随着多模态AI竞争加剧,定价策略将成为各大厂商争夺开发者的关键因素之一。