人工智能領軍企業OpenAI近日公布了其最新語音模型Gpt-Realtime-2的詳細計價標準。根據官網披露的信息,該模型對音頻輸入令牌的收費標準為每100萬個令牌32美元,而音頻輸出令牌的定價則為每100萬個64美元。
這一差異化定價策略凸顯了音頻處理過程中輸出生成環節更高的計算資源消耗。與文本模型相比,音頻模型需要更復雜的聲學建模和信號處理技術,特別是在實時交互場景下對延遲控制有着嚴苛要求。
行業觀察人士指出,此次定價體系為開發者評估語音AI應用成本提供了明確參考,也將影響未來語音交互產品的商業化路徑。隨着多模態AI競爭加劇,定價策略將成為各大廠商爭奪開發者的關鍵因素之一。