8月19日晚间,DeepSeek官方悄然上线了全新的V3.1版本。 官方公告强调了上下文长度拓展至128k,但随着社区的深入挖掘和实测,这次“小更新”之下其实有着更多模型架构的变革和模型重点能力的微调,在编程能力上的提升也可圈可点,成本优势重回显著。 然而,模型融合的技术路线也引发激烈争论,部分用户反馈旧版模型的“顽疾”复现,对这次更新的评价呈现出两极分化的态势。 发布两天后,DeepSeek官方...
网页链接8月19日晚间,DeepSeek官方悄然上线了全新的V3.1版本。 官方公告强调了上下文长度拓展至128k,但随着社区的深入挖掘和实测,这次“小更新”之下其实有着更多模型架构的变革和模型重点能力的微调,在编程能力上的提升也可圈可点,成本优势重回显著。 然而,模型融合的技术路线也引发激烈争论,部分用户反馈旧版模型的“顽疾”复现,对这次更新的评价呈现出两极分化的态势。 发布两天后,DeepSeek官方...
网页链接免责声明:投资有风险,本文并非投资建议,以上内容不应被视为任何金融产品的购买或出售要约、建议或邀请,作者或其他用户的任何相关讨论、评论或帖子也不应被视为此类内容。本文仅供一般参考,不考虑您的个人投资目标、财务状况或需求。TTM对信息的准确性和完整性不承担任何责任或保证,投资者应自行研究并在投资前寻求专业建议。