学术能力超博士,马斯克的Grok 4来了

投资界
Jul 10, 2025

原标题:学术能力超博士,马斯克的Grok 4来了 来源:凤凰网

北京时间7月10日中午12时左右,马斯克旗下xAI公司推出的Grok-4系列模型终于发布。只是开始的比原定计划时间整整晚了一个小时。

直播一开场,马斯克就搬出一句熟悉的台词:“这是世界上*的AI,让我们来展示一下”。只不过最豪迈的发言搭配的发布形式“略显潦草”,有观看直播的网友吐槽,“老马满脸疲惫”。

马斯克特别表示,在学术问题上,Grok 4能在所有学科中达到甚至超越人类博士水平。他还特别自信地预测,Grok 4有望在今年内为人类带来“发现新科学技术”的突破,并可能在明年发现新的物理现象。

根据规划,xAI还将在8月发布编程模型,9月发布多模态智能体,10月发布视频生成模型。

Grok-4到底有多强?比最强(SOTA)更强

在多项严苛的基准测试中,Grok 4都堪称*。在被称为“人类最终考试”的HLI(Humanities Last Exam)基准中,该模型在未使用工具的情况下解决了25%的问题。

而其多智能体版本Grok 4Heavy,通过并行协作,多一点时间思考,进一步将文本子集问题的解决率提升至超过50%,也是所有模型中首次突破这一数值的。

此外,Grok 4还在包括PhD级别问题集在内的所有推理基准测试中表现出色,甚至在编码基准和数学竞赛中取得了满分,通常比第二名模型有显著*。

xAI方面介绍,本次发布能够实现远超各类SOTA的成绩,本质上是范式和计算量的跃迁。

与Grok 2相比,Grok 4训练量增加了100倍,并且还在持续扩张。特别是在推理和强化学习(RL)方面,Grok 4投入了大量计算资源,其RL计算量是其他任何模型的10倍以上。

要知道在AI领域,xAI一直以“豪”著称,拥有包含10万块H100 GPU的“世界超级计算机”。Grok 2在12个月前还只是一个概念,而如今的标准下,Grok 2的模型智能水平已相当于高中生。

目前,Grok 4的订阅费是30美元/月,Grok 4 Heavy的费用为300美元/月,Grok 3维持免费状态。换算下,最贵的Heavy年费直逼2.1万元人民币了。

除了基础模型能量的大幅提升外,xAI还公布了Grok语音模式的大升级,端到端延迟降低一半,并引入了多款更自然、富有情感的新声音,例如具有史诗般低沉声线的Sal和能表达丰富情感的英伦女声Eve。

尽管Grok 4在多模态理解(特别是图像理解和生成)方面仍存在“部分盲点”,但xAI表示,其基础模型的第七个版本(计划在几周内完成训练)将解决这一弱点,未来模型将能够像人类一样“听到和看到世界”。

在Google等已经取得显著突破的视频生成领域,xAI也紧咬不放,称正在推进模型的训练,预计今年将出现首部可观看的AI生成电视节目片段,明年有望出现首部AI电影。

另有用户已经发现,特斯拉最新固件里已经偷偷加上了Grok的全功能版本,就差激活了。未来,xAI还设想Grok与特斯拉Optimus类人形机器人结合,通过与现实物理世界的互动,将能更深层次地验证假设,推动AI能力的最终飞跃。

写在最后

这次发布会还都是老面孔,比如Yuhuai Wu(吴宇怀),本次发布会右二,作为xAI的联合创始人,上一次Grok3发布的时候就已经引起国内注目了。

他在2021年博士毕业于多伦多大学机器学习专业,博士期间曾在 Deepmind和 OpenAI实习,同时也在斯坦福做博士后研究。坐在他左边的是他在多伦多大学的老师,也是xAI核心成员吉米·巴(Jimmy Ba)。

从创立之初xAI的华人含量就不低,联合创始人Greg Yang(杨格),出生于湖南,初中开始前往美国学习,本科和硕士学位都在哈佛大学数学系攻读。杨格的履历十分丰富,与苹果谷歌高通英伟达都曾有过关联。2018年,Greg Yang获得了本科生数学领域的最高荣誉Morgan Prize,之后加入了微软雷蒙德研究院,任高级研究员。

目前,据社交网络上分享的图片,xAI的华人工程师含量已经快接近一半了。

海量资讯、精准解读,尽在新浪财经APP

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10