xAI CEO埃隆 · 馬斯克今天在X平台表示,Grok 4.20將在下周發布,相比4.1版改進重大。
作為參考,Grok 4.1發布於去年11 月,繼承前代模型敏銳的智能與高可靠性,在創造性、情感理解和協作互動方面實現了重大改進,當時在LMArena文本能力排行榜以1483的Elo分數高居榜首,領先第二名達31分。
更引人注目的是,當時Grok 4.1無需深度思考的「即時響應」版本也以1465的Elo分數位列第二,性能甚至超越了其他所有模型的「全推理」模式。這一成績相較於前代Grok 4(排名第33位)實現了巨大飛躍,也印證了其在底層能力上的絕對優勢。
值得注意的是,Grok 4.1當時還改進了「幻覺」出現率,為用戶提供更可靠、更準確的信息。
美股頻道更多獨家策劃、專家專欄,免費查閱>>
責任編輯:鍾離