Jeffrey Dastin/Deepa Seetharaman
路透社9月29日 - Anthropic公司周一发布了Claude 4.5人工智能模型,称最新版本可以不间断地进行更长时间的编码,并能更好地处理金融和科学任务,这家初创公司正在深入企业人工智能领域。
这家由 Alphabet GOOGL.O 和亚马逊(Amazon.com)AMZN.O 支持的人工智能初创公司正在与竞争对手竞争,以建立能够可靠操作软件和完成多步骤工作的模型,这是人工智能代理的关键,人工智能代理可以代表人类执行任务。
首席产品官迈克-克里格(Mike Krieger)说,Sonnet 4.5模型在内部测试中从零开始创建了一个网络应用程序,一位客户让人工智能聊天机器人自主编写代码长达30小时,比Anthropic早先为另一位客户开发的Claude Opus 4实现的7小时运行时间要长。
他说,Anthropic公司的目标客户是高级用户和企业客户,而不是追逐病毒式的消费时刻。
该公司表示,Claude 4.5 在金融和科学推理方面更强,在使用计算机方面更出色,在测试操作系统灵巧性的基准测试中得分约为 60%,而以前的型号得分约为 40%。
"首席科学官杰瑞德-卡普兰(Jared Kaplan)说:"如果你不是编码员,当你看到模型像人一样使用计算机时,你会感觉更直观。
另外,微软在本周一表示,它将增加由Anthropic模型驱动的Microsoft 365 Copilot新功能,包括Excel和Word中的 "代理模式 "以及Copilot聊天中的 "Office代理",PowerPoint也将跟进。
微软上周表示,将把Anthropic的模型引入Microsoft 365 Copilot,以超越长期合作伙伴OpenAI,实现多样化。
Anthropic公司由OpenAI的前高管创立,它将Claude定位为工作场所使用,并设置了防护栏,称可以减少风险输出。该公司一直在向监管行业和希望模型能在多种软件工具中工作的团队推销 Claude 的编码和数据分析技能。
克里格说,公司的重点是在长期任务中实现持续、可靠的性能,而不是短期演示。
(为便利非英文母语者,路透将其报导自动化翻译为数种其他语言。由于自动化翻译可能有误,或未能包含所需语境,路透不保证自动化翻译文本的准确性,仅是为了便利读者而提供自动化翻译。对于因为使用自动化翻译功能而造成的任何损害或损失,路透不承担任何责任。)