新浪科技訊 1月8日上午消息,智譜AI今日上市,新浪科技了解到,上市當天,清華大學計算機系教授、智譜創立發起人兼首席科學家唐傑發佈內部信,宣佈很快將推出新一代模型 GLM-5。並進一步明確了2026年公司的目標是「成為國際領跑的大模型企業」。
唐傑提及了DeepSeek出現帶給自己的警醒道:「文鋒2023年創業的時候和我聊過,當時我並沒有意識到他對AGI如此執着,感謝他帶給我很多不一樣的思考。」唐傑稱,「選擇對AGI技術的執着追求,不斷探索AGI的上界,同時精準的未來預判成為下一步智譜需要不斷改進和昇華的地方。」
在他看來,真正決定下一階段格局的,還是更底層的兩件事——模型架構與學習範式。同時,應用側可能會出現一個清晰的方向:AI替代不同工種/任務的爆發年。基於這一判斷,智譜在2026年將聚焦於以下四個方面:
一,很快GLM-5將跟大家見面,通過進一步的Scaling和很多全新技術改進,相信GLM-5會帶給大家很多新奇體驗,讓AI幫大家完成更多真實任務。
二,全新的模型架構設計。已經廣泛使用近10年的Transformer架構已經顯露出一些不足,包括超長上下文的計算開銷、記憶機制、更新機制等。這些都需要探索全新的模型架構,發現新的Scaling範式,通過芯片-算法協同設計等技術提高計算效率。
三,具有更強泛化能力的RL。當前主流的RLVR範式雖然在數學和代碼領域取得了成功,但其依賴人工構造可驗證環境的侷限性也日益凸顯。今年需要探索更通用的RL範式,支持AI不僅能在人類指令下完成特定任務,更要能理解並執行跨越數小時甚至數天的長時程任務。
四,最具挑戰性的探索,是開啓通往持續學習與自主進化的道路。當前所有主流的AI模型,其智能在部署後基本上是靜態的。它們通過一次性的、耗資巨大的訓練過程獲得知識,然後在應用中逐漸過時。這與人腦能夠從與世界的持續交互中不斷學習、進化的方式截然不同。我們需要對下一代學習範式——在線學習(Online Learning)或持續學習(Continual Learning)進行前瞻性佈局。(文猛)
責任編輯:宋雅芳