IT之家 6 月 26 日消息,彭博社最新披露一份 6 月 24 日公示的美國法院文件,代表近 400 家紙媒的出版商聯盟指控微軟和 OpenAI 公司,稱其未經許可抓取網站內容用於訓練 AI。
該聯盟於本周三向美國紐約南區聯邦地區法院提起訴訟,指控微軟和 OpenAI 兩家公司未經授權抓取新聞內容,用於訓練 Copilot 和 ChatGPT 等 AI 背後模型,涉嫌侵犯版權,並觸犯《數字千年版權法》。
起訴書稱,被告「系統性且祕密地」爬取出版商的網站,並將文章、故事和其他原創作品複製到自己的服務器上,用它們來訓練大型語言模型,同時從作品中刪除版權管理信息。
原告表示,這些生成式人工智能產品建立在出版商長期投入的內容之上,卻為被告帶來數十億美元市場價值,而出版商「1 分錢都沒拿到」。原告同時強調,若 AI 公司濫用新聞內容而不承擔責任,本輪 AI 熱潮可能成為地方新聞業的「喪鐘」。
代表原告的新澤西州前總檢察長馬修 · 普拉特金(民主黨)在接受採訪時表示,這起訴訟是地方和區域報紙發起的最大規模的法律行動。
OpenAI 發言人 Drew Pusateri 回應稱,公司模型推動創新,訓練所用數據來自公開可獲得的數據,並以合理使用為基礎。微軟方面未立即回應媒體置評請求。