维基百科寻求公平补偿以抵消人工智能搜刮造成的服务器成本
经济负担凸显人工智能模型如何不断训练非营利组织的数据
维基百科考虑采用技术工具限制人工智能抓取
Deborah Mary Sophia/Krystal Hu
路透12月4日 - 维基百科的联合创始人吉米-威尔士(Jimmy Wales)周三表示,维基百科正在与大科技公司合作,达成类似于与谷歌的交易安排,以帮助该公司将人工智能公司对其内容的严重依赖货币化。
威尔士在纽约路透 NEXT 峰会 (link) 上接受采访时说,科技公司使用免费提供的维基百科知识来训练它们的大型语言模型,导致维基百科的非营利运营商必须承担成本激增。
"爬取维基百科的人工智能机器人正在爬取整个网站......。因此,我们必须拥有更多的服务器、更多的 RAM 和内存来缓存这些内容,而这给我们带来了过高的成本,"威尔士说。
威尔士说,虽然维基百科的内容根据其许可对个人仍然是免费的,但营利实体的大量自动访问则是另一回事。他指出,维基百科已经与Alphabet旗下的GOOGL.O谷歌公司签署了协议,与其他公司的讨论也在进行中。
运营维基百科的维基媒体基金会于2022年与谷歌达成协议,由科技巨头支付维基百科内容的培训访问费用,这些内容是OpenAI和Meta Platforms META.O等公司用来训练人工智能模型的数据的重要组成部分。
该基金会的主要收入来源是公众的小额捐款,威尔士说,这些捐款并不是为了资助价值数十亿美元的商业人工智能产品的开发。
"维基百科是由志愿者支持的。这些人捐钱是为了支持维基百科,而不是为了补贴OpenAI花掉我们一大笔钱。威尔士说:"这不公平。
推动更多许可的做法使世界上最大的免费知识库与蓬勃发展的人工智能产业陷入了潜在的僵局。它提出了一些根本性的问题:谁应该承担推动人工智能革命的庞大数据集的成本,以及营利性公司是否有义务补偿帮助其建立技术的公共和非营利来源。
当被问及维基百科是否会对使用其内容却不支付培训费用的人工智能公司采取法律行动时,威尔士说:"我不知道:威尔士说:"我不知道。我觉得我们只是羞辱他们的软实力可能相当强大。"
威尔士说,维基百科还可能考虑使用技术措施,比如Cloudflare的AI抓取控制(AI Crawl Control),让客户限制AI机器人在什么时候以及以什么方式从互联网上抓取内容。他承认,鉴于维基百科在意识形态上致力于知识的开放获取,这可能会造成两难局面,但他强调必须解决财务负担问题。
维基媒体基金会作为非营利实体运营维基百科已有二十多年,依靠全球志愿编辑社区和公众捐款提供免费信息。
尽管取得了成功,但该平台一直在努力保持中立观点,尤其是在有争议的政治和社会问题上。威尔士指出,虽然绝大多数编辑都不是激进分子,但在全球重大冲突中保持冷静中立是一项挑战,但该社区 "即使在这种情况下也能做得很好"。
点击 (link) 观看世界舞台直播,点击 (link) 阅读完整报道。
(为便利非英文母语者,路透将其报导自动化翻译为数种其他语言。由于自动化翻译可能有误,或未能包含所需语境,路透不保证自动化翻译文本的准确性,仅是为了便利读者而提供自动化翻译。对于因为使用自动化翻译功能而造成的任何损害或损失,路透不承担任何责任。)