新浪科技訊 3月25日上午消息,今日舉辦的2026中關村論壇年會上,月之暗面Kimi創始人楊植麟分享指出,大模型訓練正進入第三個階段——AI主導研究。
楊植麟指出,三年之前,大模型訓練更多地是使用從整個互聯網獲取的天然數據,加上一些少量的人工標註數據是否符合你的價值觀或者偏好。到去年,大家更加重視大規模的強化學習系統,在這裏麪人會去精選一些高質量的任務,但是這些任務還是由人來確定,然後通過在這些任務上做強化學習,得到更好的效果。
「但是從今年到明年以及接下來的若干年,整個AI研究和研發的方式會發生重大的變化,會有更多的是AI去主導這個研究,每個研究員會配備非常多的AI的Token,由Token幫你去合成新的任務和環境,去幫你定義在這個環境下面到底什麼樣是最好最合適的獎勵參數,甚至幫你探索新的網絡架構。」楊植麟表示。
在他看來,在這樣的前提下,整個AI的研發也會逐漸加速,月之暗面希望能跟整個開源社區一起去不斷地把智能技術往前推進,打造一個更好的生態系統。(文猛)
海量資訊、精準解讀,盡在新浪財經APP
責任編輯:常福強