ChainCatcher消息,去中心化 AI 基礎設施公司 Gata 宣佈推出全球大規模真實用戶 ChatGPT 對話數據集 ChatGPT-RealUser-2.2M。該數據集通過 Gata 的 GPT-to-Earn 計劃(用戶自願參與)收集,自 2024–2025 年間共彙集超過 224 萬條真實對話、近 356 萬組問答,來自超 1.5 萬位真實用戶,涵蓋與 GPT-3.5、GPT-4 和 o1 的交互。
據介紹,該數據集約為 Allen Institute for AI 以往同類數據集的兩倍規模,覆蓋真實場景、多輪對話,並因鏈上激勵機制,包含大量加密相關交互。預覽版已在 Hugging Face 上線,包含 600 條對話樣本,完整數據集可用於研究與商業應用。
據悉,2025 年 5 月 Gata 曾宣佈完成包括 YZi Labs、IDG Blockchain等參投的總額 400 萬美元種子輪孖展。