維基百科尋求公平補償以抵消人工智能搜刮造成的服務器成本
經濟負擔凸顯人工智能模型如何不斷訓練非營利組織的數據
維基百科考慮採用技術工具限制人工智能抓取
Deborah Mary Sophia/Krystal Hu
路透12月4日 - 維基百科的聯合創始人吉米-威爾士(Jimmy Wales)週三表示,維基百科正在與大科技公司合作,達成類似於與谷歌的交易安排,以幫助該公司將人工智能公司對其內容的嚴重依賴貨幣化。
威爾士在紐約路透 NEXT 峯會 (link) 上接受採訪時說,科技公司使用免費提供的維基百科知識來訓練它們的大型語言模型,導致維基百科的非營利運營商必須承擔成本激增。
"爬取維基百科的人工智能機器人正在爬取整個網站......。因此,我們必須擁有更多的服務器、更多的 RAM 和內存來緩存這些內容,而這給我們帶來了過高的成本,"威爾士說。
威爾士說,雖然維基百科的內容根據其許可對個人仍然是免費的,但營利實體的大量自動訪問則是另一回事。他指出,維基百科已經與Alphabet旗下的GOOGL.O谷歌公司簽署了協議,與其他公司的討論也在進行中。
運營維基百科的維基媒體基金會於2022年與谷歌達成協議,由科技巨頭支付維基百科內容的培訓訪問費用,這些內容是OpenAI和Meta Platforms META.O等公司用來訓練人工智能模型的數據的重要組成部分。
該基金會的主要收入來源是公衆的小額捐款,威爾士說,這些捐款並不是為了資助價值數十億美元的商業人工智能產品的開發。
"維基百科是由志願者支持的。這些人捐錢是為了支持維基百科,而不是為了補貼OpenAI花掉我們一大筆錢。威爾士說:"這不公平。
推動更多許可的做法使世界上最大的免費知識庫與蓬勃發展的人工智能產業陷入了潛在的僵局。它提出了一些根本性的問題:誰應該承擔推動人工智能革命的龐大數據集的成本,以及營利性公司是否有義務補償幫助其建立技術的公共和非營利來源。
當被問及維基百科是否會對使用其內容卻不支付培訓費用的人工智能公司採取法律行動時,威爾士說:"我不知道:威爾士說:"我不知道。我覺得我們只是羞辱他們的軟實力可能相當強大。"
威爾士說,維基百科還可能考慮使用技術措施,比如Cloudflare的AI抓取控制(AI Crawl Control),讓客戶限制AI機器人在什麼時候以及以什麼方式從互聯網上抓取內容。他承認,鑑於維基百科在意識形態上致力於知識的開放獲取,這可能會造成兩難局面,但他強調必須解決財務負擔問題。
維基媒體基金會作為非營利實體運營維基百科已有二十多年,依靠全球志願編輯社區和公衆捐款提供免費信息。
儘管取得了成功,但該平臺一直在努力保持中立觀點,尤其是在有爭議的政治和社會問題上。威爾士指出,雖然絕大多數編輯都不是激進分子,但在全球重大沖突中保持冷靜中立是一項挑戰,但該社區 "即使在這種情況下也能做得很好"。
點擊 (link) 觀看世界舞臺直播,點擊 (link) 閱讀完整報道。
(為便利非英文母語者,路透將其報導自動化翻譯為數種其他語言。由於自動化翻譯可能有誤,或未能包含所需語境,路透不保證自動化翻譯文本的準確性,僅是為了便利讀者而提供自動化翻譯。對於因為使用自動化翻譯功能而造成的任何損害或損失,路透不承擔任何責任。)