AI Agent冲破屏幕,中国汽车人迎来自己的司机助理

虎嗅APP
昨天

舱驾融合,是汽车智能化由情绪价值向实际价值变化的关键点。

车企们卷屏幕尺寸、卷语音包的拟人度、卷氛围灯的呼吸频率。所谓先进的智能座舱,总是逃不开“情感陪聊”或“解压空间”的范式,你可以在车里刷剧、唱K、用语音开关下车辆功能。

但在最核心的出行逻辑里,它依然是一个脑肢分离的半成品,座舱管你的心情,智驾闷头开车,两者老死不相往来,唯一有关联的,是屏幕上的导航和3D模型。

这种分裂导致了一个尴尬的现实:所谓的智能,并没有帮你解决掉任何实质性的麻烦。你想去接孩子顺便买束花,智舱模型听的懂你的意图,却指挥不动底盘和智驾系统。最终,你还是得在“情绪大脑”和“执行身体”之间充当那个卑微的人肉协调员。

根据麦肯锡出具的《中国汽车消费者洞察》,尽管智能化配置日益奢靡,但超过70%的车载App在提车三个月后即陷入永久沉睡;虽然高阶智驾(NOA)的购车意向率高达80%,但用户在大多数时候依然选择“亲自上阵”。

特斯拉的Grok+FSD给出了版本的前瞻答案。马斯克的逻辑依旧第一性原理:理解世界的大模型(Grok)和大模型驱动的智驾系统(FSD)直接打通,把汽车从电子产品直接变成具身智能

从在美国的测试体验来看,这套方案确实惊艳:只需要用自然语义表达自己的出行目标,特斯拉会自动规划目的地,并给到自动驾驶和语义的双反馈。

但这套方案毕竟高度垂直,在中国这个更开放也更多元的智能化场地,谁能把这套逻辑真正工业化落地?

合并汽车的左右脑

2025年7月,马斯克宣布Grok登陆特斯拉。最初外界以为这只是给车里换了个更聪明的语音助手,但很快,北美第一批拿到的用户发现这事儿变了味。

当你按住按键说出:“带我去公司,顺便路过那家我常去的咖啡店,电量如果不够撑到终点就提醒我。”

从本质来看,这是在给整车下达一个复杂的“复合任务”。背后的逻辑是:Grok解析语义,同时调取你的历史轨迹(常去店址),选择对应的咖啡店,基于实时路况、电池剩余电量以及FSD的行驶路径规划,形成一个“任务规划”而非“导航路线”

而特斯拉不仅能做到,还能不断地根据最新的路况和现实情况进行调整,它让汽车从一个被动的“执行工具”变成了一个主动地“司机助手”。

英伟达专家Jim Fan,这位英伟达人形机器人通用模型Project GR00T的领军人物,激动地将这种体验称为“物理图灵测试”的雏形——因为你分不清开车的到底是一段代码,还是一个极度懂你的老司机。

这种“张嘴即可得”的爽感,本质上是把大模型从“聊天的屏幕”里拽了出来,直接塞进了智驾的“执行层”。这中间有大量的兼容和适配要做。

以前车里的座舱和智驾,像两个完全语言不通、甚至办公地点都不在一起的部门:智舱跑的是安卓系统,求的是生态热闹;智驾跑的是QNX,求的是绝对安全可靠。

要把大模型塞进“执行层”,本质上需要给整车打造一门“通用语言”,解决掉复杂的底层通讯协议的延迟,更难的是任务拆解和翻译”。

大模型需要把模糊的人类语言,瞬时并精准的翻译成线控底盘和智驾系统能听懂的指令。以往智舱只能看App的数据,智驾只能看摄像头的数据,现在的逻辑是:模型能同时调用视觉信息、地理位置、剩余电量甚至你过往的驾驶习惯,并把这些碎块化的数据,拼成一个完整的行动逻辑。

3月18日,智己发布了IM Fusion Nova架构,成为国内首个通过大模型实现“舱驾融合”体验的解决方案。同时有别于特斯拉高度垂直封闭的自研体系,智己以一种更开放的姿态,接入了全球目前最强的开源大模型——阿里千问。

这个在春节期间靠着“一句话跨App下单外卖”刷屏的大模型,上车后的角色从“电子宠物”变成了“首席执行官”。在Fusion Nova的逻辑里,千问不再只负责文字回复,而是直接生成“任务流”。

当你说出“带我去接娃顺便买花”这种复合意图时,它不仅能够自动调取高德导航规划最优路径,同步指令给智驾模型启动路线,更能联动支付Agent完成鲜花挑选和预订,并让智驾在接娃点和花店路边精准靠停。

这种Intent to Motion(意图即动作)的闭环,标志着汽车真正从“加上屏幕的交通工具”,向着“四轮机器人”启动进化。

线控,AI上车的标配

如果说大模型是智己的“大脑”,那么线控底盘就是它的“神经中枢”。这也是区分真智能与“伪智能”的一道分水岭。

过去一百年里,人类对驾驶的感知是极其模糊的:你凭感觉踩刹车,凭经验打方向,所谓的“操控性”本质上是人类神经系统对机械惯性的被动妥协。但血肉之躯的反应时延通常在200-300毫秒,且人类无法感知四轮抓地力在毫秒间的微观变化。

AI一旦上车,这个问题的复杂度就要再上一个级别:传统的机械底盘操控,根本配不上现在的AI算法。

你以为智驾算法跑得快就够了?但在工业时代的传动轴面前,AI的算力就像被困在屏幕里的残疾人。如果底盘的“反馈神经”还停留在液压泵和机械拉索上,那么算法预判得再准,落到轮端执行时也已经成了延迟极高的“马后炮”。

为什么说智己让大模型开车是认真的?因为他们直接掏出了全线控的“灵蜥数字底盘”。

线控以前更多的停留在实验室,只有特斯拉Cybertruck、蔚来ET9这样极少数的技术图腾上。有的为了追求纯粹的技术溢价,有的为了展示整车架构的颠覆性。

而智己的逻辑更直接,它只是为了给AI找个好身体,通过IM Fusion Nova架构,无论是人的驾控还是AI的指令,仅需20毫秒即可完成信号传递到动作执行,较传统转向快4倍以上,并有三重安全冗余确保其几无失效可能。

大模型+线控底盘,彻底跳出了人类“模糊车感”的局限,智己完成了全车从操控到执行的全数字化,线控底盘和大模型能以人类无法企及的精度,寻求每一秒出行驾驶和乘坐体验的最优解。

这不只是体验的升级,更是通向L3、L4的物理基石。业内公认,2026年将成为“线控元年”,也将是L3的爆发之年。在这个节点上,智己开始灵蜥3.0的应用,已经开始通过大规模量产,为下一代实现彻底智能化的车型做好了准备。

毕竟,没有线控底座的智驾,只是在拙劣地模拟人的操作;有了线控底盘的具身智能,才是真正意义上对驾驶主权的物理接管。

看得到,不如买得到

大模型上车,有一个绕不开的技术悖论:大模型(LLM)天生自带“幻觉”,它偶尔会一本正经地胡说八道。如果你把驾驶权交给一个可能“胡言乱语”的AI,这事儿听起来像是在玩命,这也是Grok+FSD现在仍然只停留在测试的原因。

智己直面并给出了行业示范的解法,叫非对称式安全护栏。座舱里的大模型拥有极高的“创意权”,它负责去理解那些发散的、模糊的人类意图,但涉及到控车的物理决策,则回到了拥有L4级能力,只讲规则的异构安全域。

再直白点讲,大模型负责“出主意”,但最终“能不能做”以及“怎么做”,必须经过安全规范的逻辑二次校验,它解决了大模型不确定性与驾驶绝对安全性之间的矛盾。也是智己敢于即将在量产车型中实际应用这套“大模型”方案的底气。

即将在3月26日开启预售的智己LS8,将首搭IM Ultra Agent 1.0版本。这就意味着,LS8将成为“千问大模型全球首个上车+L4级智驾能力+线控数字底盘”的一台车。

在智己的内部版图里,LS8的角色非常关键,向上与去年上市的LS9组成“双旗舰”,负责站住技术天花板;向下又与LS6构成“销量双子星”,负责在主流市场收割订单。而AI大模型首发搭载,显然是看中了LS8的独特定位。

马斯克的Grok+FSD展现的是一种封闭的、高度垂直的英雄主义路径——这套逻辑确实迷人,但也极其排他。

而在中国这个卷到极致、生态复杂的智能化场地,智己跑通的是一条更具产业参考价值的“生态协同方式”:接入阿里成熟的Agent生态(支付宝、高德、飞猪),再配合上汽70年的制造积淀,让专业的仍然各自属于专业,而各自的进化都将为车型这个“交叉点”带来更多可能。

过去的一年,中国车市疯狂“卷9系”,各大厂都在不计成本地堆砌技术图腾。而2026年,行业的战火注定将延烧至更具普适性的“8系”战场。在新战局开启的前夜,智己LS8凭借“全线控灵蜥底盘+舱驾融合大模型”的双重护城河,已经提前占领了技术高地,锁定了“2026年最值得期待的8系旗舰”的一席

更具杀伤力的是,这样一款配置顶格、定价亲民的走量车型,普遍预测价格将不到30万。这意味着,AI时代的最前沿技术,将第一次变得如此触手可及。

而当“大模型开车”不再是硅谷博主的特权,中国消费者也就终于等到了AI上车动真格、且买得到的时刻。

推广

免责声明:投资有风险,本文并非投资建议,以上内容不应被视为任何金融产品的购买或出售要约、建议或邀请,作者或其他用户的任何相关讨论、评论或帖子也不应被视为此类内容。本文仅供一般参考,不考虑您的个人投资目标、财务状况或需求。TTM对信息的准确性和完整性不承担任何责任或保证,投资者应自行研究并在投资前寻求专业建议。

热议股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10