新浪科技讯 3月25日上午消息,今日举办的2026中关村论坛年会上,月之暗面Kimi创始人杨植麟分享指出,大模型训练正进入第三个阶段——AI主导研究。
杨植麟指出,三年之前,大模型训练更多地是使用从整个互联网获取的天然数据,加上一些少量的人工标注数据是否符合你的价值观或者偏好。到去年,大家更加重视大规模的强化学习系统,在这里面人会去精选一些高质量的任务,但是这些任务还是由人来确定,然后通过在这些任务上做强化学习,得到更好的效果。
“但是从今年到明年以及接下来的若干年,整个AI研究和研发的方式会发生重大的变化,会有更多的是AI去主导这个研究,每个研究员会配备非常多的AI的Token,由Token帮你去合成新的任务和环境,去帮你定义在这个环境下面到底什么样是最好最合适的奖励参数,甚至帮你探索新的网络架构。”杨植麟表示。
在他看来,在这样的前提下,整个AI的研发也会逐渐加速,月之暗面希望能跟整个开源社区一起去不断地把智能技术往前推进,打造一个更好的生态系统。(文猛)
海量资讯、精准解读,尽在新浪财经APP
责任编辑:常福强