Anthropic声称被Deepseek蒸馏!马斯克为啥怼?

市场资讯
Feb 24

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

  来源:第四波

  研究员|冯皓钦

  近日,科技圈有一条争议不小的消息。

  Anthropic 发布声明,指控三家中国AI公司:DeepSeek、Moonshot AI 和 MiniMax对其大模型 Claude 进行大规模“蒸馏”。

  根据披露的数据,对方通过超过2.4万个虚假账号,与Claude进行了约1600万次交互,用来抽取模型能力训练自家模型。Anthropic称,这种行为并非正常使用,而是系统化、工业级的能力提取。他们形容为“hydra cluster”,即一个网络同时管理大量账号,请求结构高度重复,集中瞄准推理能力、Agent工具使用、编程与思维链输出等关键能力。

  Anthropic的帖子

  蒸馏是常规技术,争议在于“规模与方式”

  所谓“蒸馏”(distillation),是AI领域常见的训练方法。简单来说,就是利用一个性能更强的“教师模型”生成输出数据,再用这些数据训练一个“学生模型”,从而在参数规模更小、成本更低的情况下复现部分能力。

  目前在AI训练上,蒸馏被广泛用于模型压缩、轻量化部署以及能力迁移等,这本身并非新技术,也并不带有天然的违规属性。

  此次争议的焦点在于方式与规模。Anthropic称,这三家公司通过共享支付方式、代理服务和批量化请求结构,系统性抽取Claude在推理能力、思维链输出、Agent工具使用以及编程能力等方面的表现。

  具体而言,DeepSeek被指进行超过15万次交互,侧重推理能力与思维链数据;Moonshot AI约340万次交互,聚焦Agent能力与工具调用;MiniMax数量最大,约1300万次交互,集中在Agent编排与工具使用,并被指在新版本发布后迅速切换抽取目标。

  Anthropic表示,他们通过行为识别与异常检测模型发现这一模式,并强调这种行为可能削弱模型原有的安全护栏,因此呼吁行业与云服务商采取更严格的防护措施。

  舆论分歧与“蒸馏边界”的讨论

  不过,争议很快蔓延到舆论层面。

  此次事件一出,Elon Musk 在X上隔空抨击Anthropic大规模盗用训练数据,发帖直言, Anthropic 本身也曾因训练数据问题饱受争议,并讽刺称:“你偷来的东西被偷了?”

  据悉,此前,2023年Elon Musk就曾对Anthropic蒸馏其它大模型公司的数据进行嘲讽。

  需要指出的是,Anthropic此前确实曾卷入过关于训练数据来源的版权诉讼,并支付了巨额赔偿,目前相关争议仍处于法律与舆论层面的博弈中。

  并且就在事件发生不久后,Elon Musk又转载一AI科技业内人士的帖子称,Anthropic公司没有得到任何人的同情。他们利用公共数据构建的封闭模式攫取价值,并招致我们目前所见的监管俘获。他们既想继续利用现有数据,又想通过特殊规则来保护自身利润。并直言到,当技术具有如此颠覆性时,这种模式无疑是有害且具有腐蚀性的。

  马斯克转载的帖子

  围绕本次指控,行业内部也出现不同声音。一部分观点认为,本次争议的重点并不在蒸馏技术本身,而在具体实施方式。如果确实存在大量虚假账号、批量化请求、结构化提取模型核心能力的行为,且绕过服务条款或地区限制,那么问题已超出技术范畴,可能涉及商业合规与不正当竞争。

  也有创作者和评论者表达更为情绪化的观点,声称他们并不在乎其它公司对 Claude 进行“蒸馏”的做法。并且有评论认为,大模型本身建立在互联网公开数据之上,训练数据来源长期处于版权争议之中。在这种背景下,再以“能力被蒸馏”为由指责竞争对手,难免被解读为“贼喊抓贼”。如果AI公司可以在未经明确授权的情况下使用互联网内容训练模型,那么当模型能力被“蒸馏”迁移时,批评者的立场显得并不牢固。

  从商业常识角度看,若存在绕过平台规则、大规模抽取核心能力的行为,确实容易引发争议;但从技术实践看,模型输出是否具备明确、可独占的产权属性,目前尚缺乏清晰的法律标准。

  这场黑色幽默之下,问题的关键也指向:蒸馏本身是行业常规技术,用强模型输出训练弱模型,本质上并不罕见。但当规模扩大到数千万次调用、并以虚假账号批量操作时,它究竟是正常竞争,还是违规抽取?

  事实上,包括 OpenAI 在内的多家头部企业,也曾在不同场景中采用蒸馏技术进行模型优化。区别在于,内部蒸馏与基于竞品输出训练模型之间,是否存在明确边界,目前仍缺乏统一标准。

资料来源: Financial Times

  当模型能力可以通过输出被“迁移”时,问题的核心早已不在技术本身,而在规则如何界定:什么属于合理使用,什么构成系统性能力抽取?巨头之间互相蒸馏的边界,仍然有待进一步厘清。

新浪声明:此消息系转载自新浪合作媒体,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
海量资讯、精准解读,尽在新浪财经APP

责任编辑:何俊熹

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10