AI Agent冲破屏幕，中国汽车人迎来自己的司机助理

舱驾融合，是汽车智能化由情绪价值向实际价值变化的关键点。

车企们卷屏幕尺寸、卷语音包的拟人度、卷氛围灯的呼吸频率。所谓先进的智能座舱，总是逃不开“情感陪聊”或“解压空间”的范式，你可以在车里刷剧、唱K、用语音开关下车辆功能。

但在最核心的出行逻辑里，它依然是一个脑肢分离的半成品，座舱管你的心情，智驾闷头开车，两者老死不相往来，唯一有关联的，是屏幕上的导航和3D模型。

这种分裂导致了一个尴尬的现实：所谓的智能，并没有帮你解决掉任何实质性的麻烦。你想去接孩子顺便买束花，智舱模型听的懂你的意图，却指挥不动底盘和智驾系统。最终，你还是得在“情绪大脑”和“执行身体”之间充当那个卑微的人肉协调员。

根据麦肯锡出具的《中国汽车消费者洞察》，尽管智能化配置日益奢靡，但超过70%的车载App在提车三个月后即陷入永久沉睡；虽然高阶智驾（NOA）的购车意向率高达80%，但用户在大多数时候依然选择“亲自上阵”。

特斯拉的Grok+FSD给出了版本的前瞻答案。马斯克的逻辑依旧第一性原理：理解世界的大模型（Grok）和大模型驱动的智驾系统（FSD）直接打通，把汽车从电子产品直接变成具身智能。

从在美国的测试体验来看，这套方案确实惊艳：只需要用自然语义表达自己的出行目标，特斯拉会自动规划目的地，并给到自动驾驶和语义的双反馈。

但这套方案毕竟高度垂直，在中国这个更开放也更多元的智能化场地，谁能把这套逻辑真正工业化落地？

合并汽车的左右脑

2025年7月，马斯克宣布Grok登陆特斯拉。最初外界以为这只是给车里换了个更聪明的语音助手，但很快，北美第一批拿到的用户发现这事儿变了味。

当你按住按键说出：“带我去公司，顺便路过那家我常去的咖啡店，电量如果不够撑到终点就提醒我。”

从本质来看，这是在给整车下达一个复杂的“复合任务”。背后的逻辑是：Grok解析语义，同时调取你的历史轨迹（常去店址），选择对应的咖啡店，基于实时路况、电池剩余电量以及FSD的行驶路径规划，形成一个“任务规划”而非“导航路线”。

而特斯拉不仅能做到，还能不断地根据最新的路况和现实情况进行调整，它让汽车从一个被动的“执行工具”变成了一个主动地“司机助手”。

英伟达专家Jim Fan，这位英伟达人形机器人通用模型Project GR00T的领军人物，激动地将这种体验称为“物理图灵测试”的雏形——因为你分不清开车的到底是一段代码，还是一个极度懂你的老司机。

这种“张嘴即可得”的爽感，本质上是把大模型从“聊天的屏幕”里拽了出来，直接塞进了智驾的“执行层”。这中间有大量的兼容和适配要做。

以前车里的座舱和智驾，像两个完全语言不通、甚至办公地点都不在一起的部门：智舱跑的是安卓系统，求的是生态热闹；智驾跑的是QNX，求的是绝对安全可靠。

要把大模型塞进“执行层”，本质上需要给整车打造一门“通用语言”，解决掉复杂的底层通讯协议的延迟，更难的是“任务拆解和翻译”。

大模型需要把模糊的人类语言，瞬时并精准的翻译成线控底盘和智驾系统能听懂的指令。以往智舱只能看App的数据，智驾只能看摄像头的数据，现在的逻辑是：模型能同时调用视觉信息、地理位置、剩余电量甚至你过往的驾驶习惯，并把这些碎块化的数据，拼成一个完整的行动逻辑。

3月18日，智己发布了IM Fusion Nova架构，成为国内首个通过大模型实现“舱驾融合”体验的解决方案。同时有别于特斯拉高度垂直封闭的自研体系，智己以一种更开放的姿态，接入了全球目前最强的开源大模型——阿里千问。

这个在春节期间靠着“一句话跨App下单外卖”刷屏的大模型，上车后的角色从“电子宠物”变成了“首席执行官”。在Fusion Nova的逻辑里，千问不再只负责文字回复，而是直接生成“任务流”。

当你说出“带我去接娃顺便买花”这种复合意图时，它不仅能够自动调取高德导航规划最优路径，同步指令给智驾模型启动路线，更能联动支付Agent完成鲜花挑选和预订，并让智驾在接娃点和花店路边精准靠停。

这种Intent to Motion（意图即动作）的闭环，标志着汽车真正从“加上屏幕的交通工具”，向着“四轮机器人”启动进化。

线控，AI上车的标配

如果说大模型是智己的“大脑”，那么线控底盘就是它的“神经中枢”。这也是区分真智能与“伪智能”的一道分水岭。

过去一百年里，人类对驾驶的感知是极其模糊的：你凭感觉踩刹车，凭经验打方向，所谓的“操控性”本质上是人类神经系统对机械惯性的被动妥协。但血肉之躯的反应时延通常在200-300毫秒，且人类无法感知四轮抓地力在毫秒间的微观变化。

AI一旦上车，这个问题的复杂度就要再上一个级别：传统的机械底盘操控，根本配不上现在的AI算法。

你以为智驾算法跑得快就够了？但在工业时代的传动轴面前，AI的算力就像被困在屏幕里的残疾人。如果底盘的“反馈神经”还停留在液压泵和机械拉索上，那么算法预判得再准，落到轮端执行时也已经成了延迟极高的“马后炮”。

为什么说智己让大模型开车是认真的？因为他们直接掏出了全线控的“灵蜥数字底盘”。

线控以前更多的停留在实验室，只有特斯拉Cybertruck、蔚来ET9这样极少数的技术图腾上。有的为了追求纯粹的技术溢价，有的为了展示整车架构的颠覆性。

而智己的逻辑更直接，它只是为了给AI找个好身体，通过IM Fusion Nova架构，无论是人的驾控还是AI的指令，仅需20毫秒即可完成信号传递到动作执行，较传统转向快4倍以上，并有三重安全冗余确保其几无失效可能。

大模型+线控底盘，彻底跳出了人类“模糊车感”的局限，智己完成了全车从操控到执行的全数字化，线控底盘和大模型能以人类无法企及的精度，寻求每一秒出行驾驶和乘坐体验的最优解。

这不只是体验的升级，更是通向L3、L4的物理基石。业内公认，2026年将成为“线控元年”，也将是L3的爆发之年。在这个节点上，智己开始灵蜥3.0的应用，已经开始通过大规模量产，为下一代实现彻底智能化的车型做好了准备。

毕竟，没有线控底座的智驾，只是在拙劣地模拟人的操作；有了线控底盘的具身智能，才是真正意义上对驾驶主权的物理接管。

看得到，不如买得到

大模型上车，有一个绕不开的技术悖论：大模型（LLM）天生自带“幻觉”，它偶尔会一本正经地胡说八道。如果你把驾驶权交给一个可能“胡言乱语”的AI，这事儿听起来像是在玩命，这也是Grok+FSD现在仍然只停留在测试的原因。

智己直面并给出了行业示范的解法，叫非对称式安全护栏。座舱里的大模型拥有极高的“创意权”，它负责去理解那些发散的、模糊的人类意图，但涉及到控车的物理决策，则回到了拥有L4级能力，只讲规则的异构安全域。

再直白点讲，大模型负责“出主意”，但最终“能不能做”以及“怎么做”，必须经过安全规范的逻辑二次校验，它解决了大模型不确定性与驾驶绝对安全性之间的矛盾。也是智己敢于即将在量产车型中实际应用这套“大模型”方案的底气。

即将在3月26日开启预售的智己LS8，将首搭IM Ultra Agent 1.0版本。这就意味着，LS8将成为“千问大模型全球首个上车+L4级智驾能力+线控数字底盘”的一台车。

在智己的内部版图里，LS8的角色非常关键，向上与去年上市的LS9组成“双旗舰”，负责站住技术天花板；向下又与LS6构成“销量双子星”，负责在主流市场收割订单。而AI大模型首发搭载，显然是看中了LS8的独特定位。

马斯克的Grok+FSD展现的是一种封闭的、高度垂直的英雄主义路径——这套逻辑确实迷人，但也极其排他。

而在中国这个卷到极致、生态复杂的智能化场地，智己跑通的是一条更具产业参考价值的“生态协同方式”：接入阿里成熟的Agent生态（支付宝、高德、飞猪），再配合上汽70年的制造积淀，让专业的仍然各自属于专业，而各自的进化都将为车型这个“交叉点”带来更多可能。

过去的一年，中国车市疯狂“卷9系”，各大厂都在不计成本地堆砌技术图腾。而2026年，行业的战火注定将延烧至更具普适性的“8系”战场。在新战局开启的前夜，智己LS8凭借“全线控灵蜥底盘+舱驾融合大模型”的双重护城河，已经提前占领了技术高地，锁定了“2026年最值得期待的8系旗舰”的一席。

更具杀伤力的是，这样一款配置顶格、定价亲民的走量车型，普遍预测价格将不到30万。这意味着，AI时代的最前沿技术，将第一次变得如此触手可及。

而当“大模型开车”不再是硅谷博主的特权，中国消费者也就终于等到了AI上车动真格、且买得到的时刻。

推广

免责声明：投资有风险，本文并非投资建议，以上内容不应被视为任何金融产品的购买或出售要约、建议或邀请，作者或其他用户的任何相关讨论、评论或帖子也不应被视为此类内容。本文仅供一般参考，不考虑您的个人投资目标、财务状况或需求。TTM对信息的准确性和完整性不承担任何责任或保证，投资者应自行研究并在投资前寻求专业建议。

老虎证券

AI Agent冲破屏幕，中国汽车人迎来自己的司机助理

热议股票