最强AI编程Claude降智 AMD高管吐槽其变得又懒又笨

快科技
Apr 07

快科技4月7日消息,作为公认的最强AI编程工具,Anthropic公司靠着Claude系列做到了年化300亿美元的收入,已经超越OpenAI,很多开发者写代码都离不开Claude了。

然而最近的一系列风波之后,Claude的风评也在变差,主要原因倒不是最近的源码泄露,而是Claude大模型升级之后变笨了,俗称降智。

不仅大量开发者在Github上吐槽,AMD的AI业务主管Stella Laurenzo也同样在抱怨,指出2月份升级之后,Claude Code写代码就一直敷衍了事,无法被信任搞定复杂的工程代码了。

Stella Laurenzo表示这不是她一个人遇到的问题,整个工作组的人员都经历了类似的情况,她还给出了具体的统计结果,分析了她和团队发起的6852次Claude代码对话,其中包括234760次工具调用和17871个思维链,表征懒惰情况的思维过早中断、寻求许可等类似违规数量都在大幅增长,3月8日之前是0,现在是每天平均10次。

Claude Code在修改代码之前的阅读次数也大幅下降,从之前的6.6次读取减少到了2次,还会开始重写整个文件,编辑代码的频率也大幅提升。

Github上网友的反馈也是差不多,Claude Code的思维链较浅时,大模型就会默认采取最低成本的操作,不读代码就编辑,不完成就停止了,逃避失败责任,采用最简单的修复而非正确方案。

Laurenzo表态希望Anthropic能公开说明他们是减少还是限制了思维链的Token,导致了Claude Code开始产生垃圾,还要求该公司增加一个最高层级的思维链,以供复杂的工程使用。

在问题没解决之前,Laurenzo表示AMD已经更换了订阅商,质量更高,但她没有说明具体是哪家的——如果说质量,目前能跟Claude一较高下的也就是OpenAI的Codex,但Codex能不能比Claude大模型质量还高,这个还真不好说。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10