AI Agent衝破螢幕，中國汽車人迎來自己的司機助理

艙駕融合，是汽車智能化由情緒價值向實際價值變化的關鍵點。

車企們卷螢幕尺寸、卷語音包的擬人度、卷氛圍燈的呼吸頻率。所謂先進的智能座艙，總是逃不開「情感陪聊」或「解壓空間」的範式，你可以在車裏刷劇、唱K、用語音開關下車輛功能。

但在最核心的出行邏輯裏，它依然是一個腦肢分離的半成品，座艙管你的心情，智駕悶頭開車，兩者老死不相往來，唯一有關聯的，是螢幕上的導航和3D模型。

這種分裂導致了一個尷尬的現實：所謂的智能，並沒有幫你解決掉任何實質性的麻煩。你想去接孩子順便買束花，智艙模型聽的懂你的意圖，卻指揮不動底盤和智駕系統。最終，你還是得在「情緒大腦」和「執行身體」之間充當那個卑微的人肉協調員。

根據麥肯錫出具的《中國汽車消費者洞察》，儘管智能化配置日益奢靡，但超過70%的車載App在提車三個月後即陷入永久沉睡；雖然高階智駕（NOA）的購車意向率高達80%，但用戶在大多數時候依然選擇「親自上陣」。

特斯拉的Grok+FSD給出了版本的前瞻答案。馬斯克的邏輯依舊第一性原理：理解世界的大模型（Grok）和大模型驅動的智駕系統（FSD）直接打通，把汽車從電子產品直接變成具身智能。

從在美國的測試體驗來看，這套方案確實驚豔：只需要用自然語義表達自己的出行目標，特斯拉會自動規劃目的地，並給到自動駕駛和語義的雙反饋。

但這套方案畢竟高度垂直，在中國這個更開放也更多元的智能化場地，誰能把這套邏輯真正工業化落地？

合併汽車的左右腦

2025年7月，馬斯克宣佈Grok登陸特斯拉。最初外界以為這只是給車裏換了個更聰明的語音助手，但很快，北美第一批拿到的用戶發現這事兒變了味。

當你按住按鍵說出：「帶我去公司，順便路過那家我常去的咖啡店，電量如果不夠撐到終點就提醒我。」

從本質來看，這是在給整車下達一個複雜的「複合任務」。背後的邏輯是：Grok解析語義，同時調取你的歷史軌跡（常去店址），選擇對應的咖啡店，基於實時路況、電池剩餘電量以及FSD的行駛路徑規劃，形成一個「任務規劃」而非「導航路線」。

而特斯拉不僅能做到，還能不斷地根據最新的路況和現實情況進行調整，它讓汽車從一個被動的「執行工具」變成了一個主動地「司機助手」。

英偉達專家Jim Fan，這位英偉達人形機器人通用模型Project GR00T的領軍人物，激動地將這種體驗稱為「物理圖靈測試」的雛形——因為你分不清開車的到底是一段代碼，還是一個極度懂你的老司機。

這種「張嘴即可得」的爽感，本質上是把大模型從「聊天的螢幕」裏拽了出來，直接塞進了智駕的「執行層」。這中間有大量的兼容和適配要做。

以前車裏的座艙和智駕，像兩個完全語言不通、甚至辦公地點都不在一起的部門：智艙跑的是安卓系統，求的是生態熱鬧；智駕跑的是QNX，求的是絕對安全可靠。

要把大模型塞進「執行層」，本質上需要給整車打造一門「通用語言」，解決掉複雜的底層通訊協議的延遲，更難的是「任務拆解和翻譯」。

大模型需要把模糊的人類語言，瞬時並精準的翻譯成線控底盤和智駕系統能聽懂的指令。以往智艙只能看App的數據，智駕只能看攝像頭的數據，現在的邏輯是：模型能同時調用視覺信息、地理位置、剩餘電量甚至你過往的駕駛習慣，並把這些碎塊化的數據，拼成一個完整的行動邏輯。

3月18日，智己發布了IM Fusion Nova架構，成為國內首個通過大模型實現「艙駕融合」體驗的解決方案。同時有別於特斯拉高度垂直封閉的自研體系，智己以一種更開放的姿態，接入了全球目前最強的開源大模型——阿里千問。

這個在春節期間靠着「一句話跨App下單外賣」刷屏的大模型，上車後的角色從「電子寵物」變成了「首席執行官」。在Fusion Nova的邏輯裏，千問不再只負責文字回覆，而是直接生成「任務流」。

當你說出「帶我去接娃順便買花」這種複合意圖時，它不僅能夠自動調取高德導航規劃最優路徑，同步指令給智駕模型啓動路線，更能聯動支付Agent完成鮮花挑選和預訂，並讓智駕在接娃點和花店路邊精準靠停。

這種Intent to Motion（意圖即動作）的閉環，標誌着汽車真正從「加上螢幕的交通工具」，向着「四輪機器人」啓動進化。

線控，AI上車的標配

如果說大模型是智己的「大腦」，那麼線控底盤就是它的「神經中樞」。這也是區分真智能與「僞智能」的一道分水嶺。

過去一百年裏，人類對駕駛的感知是極其模糊的：你憑感覺踩剎車，憑經驗打方向，所謂的「操控性」本質上是人類神經系統對機械慣性的被動妥協。但血肉之軀的反應時延通常在200-300毫秒，且人類無法感知四輪抓地力在毫秒間的微觀變化。

AI一旦上車，這個問題的複雜度就要再上一個級別：傳統的機械底盤操控，根本配不上現在的AI算法。

你以為智駕算法跑得快就夠了？但在工業時代的傳動軸面前，AI的算力就像被困在螢幕裏的殘疾人。如果底盤的「反饋神經」還停留在液壓泵和機械拉索上，那麼算法預判得再準，落到輪端執行時也已經成了延遲極高的「馬後炮」。

為什麼說智己讓大模型開車是認真的？因為他們直接掏出了全線控的「靈蜥數字底盤」。

線控以前更多的停留在實驗室，只有特斯拉Cybertruck、蔚來ET9這樣極少數的技術圖騰上。有的為了追求純粹的技術溢價，有的為了展示整車架構的顛覆性。

而智己的邏輯更直接，它只是為了給AI找個好身體，通過IM Fusion Nova架構，無論是人的駕控還是AI的指令，僅需20毫秒即可完成信號傳遞到動作執行，較傳統轉向快4倍以上，並有三重安全冗餘確保其幾無失效可能。

大模型+線控底盤，徹底跳出了人類「模糊車感」的侷限，智己完成了全車從操控到執行的全數字化，線控底盤和大模型能以人類無法企及的精度，尋求每一秒出行駕駛和乘坐體驗的最優解。

這不只是體驗的升級，更是通向L3、L4的物理基石。業內公認，2026年將成為「線控元年」，也將是L3的爆發之年。在這個節點上，智己開始靈蜥3.0的應用，已經開始通過大規模量產，為下一代實現徹底智能化的車型做好了準備。

畢竟，沒有線控底座的智駕，只是在拙劣地模擬人的操作；有了線控底盤的具身智能，纔是真正意義上對駕駛主權的物理接管。

看得到，不如買得到

大模型上車，有一個繞不開的技術悖論：大模型（LLM）天生自帶「幻覺」，它偶爾會一本正經地胡說八道。如果你把駕駛權交給一個可能「胡言亂語」的AI，這事兒聽起來像是在玩命，這也是Grok+FSD現在仍然只停留在測試的原因。

智己直面並給出了行業示範的解法，叫非對稱式安全護欄。座艙裏的大模型擁有極高的「創意權」，它負責去理解那些發散的、模糊的人類意圖，但涉及到控車的物理決策，則回到了擁有L4級能力，只講規則的異構安全域。

再直白點講，大模型負責「出主意」，但最終「能不能做」以及「怎麼做」，必須經過安全規範的邏輯二次校驗，它解決了大模型不確定性與駕駛絕對安全性之間的矛盾。也是智己敢於即將在量產車型中實際應用這套「大模型」方案的底氣。

即將在3月26日開啓預售的智己LS8，將首搭IM Ultra Agent 1.0版本。這就意味着，LS8將成為「千問大模型全球首個上車+L4級智駕能力+線控數字底盤」的一台車。

在智己的內部版圖裏，LS8的角色非常關鍵，向上與去年上市的LS9組成「雙旗艦」，負責站住技術天花板；向下又與LS6構成「銷量雙子星」，負責在主流市場收割訂單。而AI大模型首發搭載，顯然是看中了LS8的獨特定位。

馬斯克的Grok+FSD展現的是一種封閉的、高度垂直的英雄主義路徑——這套邏輯確實迷人，但也極其排他。

而在中國這個捲到極致、生態複雜的智能化場地，智己跑通的是一條更具產業參考價值的「生態協同方式」：接入阿里成熟的Agent生態（支付寶、高德、飛豬），再配合上汽70年的製造積澱，讓專業的仍然各自屬於專業，而各自的進化都將為車型這個「交叉點」帶來更多可能。

過去的一年，中國車市瘋狂「卷9系」，各大廠都在不計成本地堆砌技術圖騰。而2026年，行業的戰火註定將延燒至更具普適性的「8系」戰場。在新戰局開啓的前夜，智己LS8憑藉「全線控靈蜥底盤+艙駕融合大模型」的雙重護城河，已經提前佔領了技術高地，鎖定了「2026年最值得期待的8系旗艦」的一席。

更具殺傷力的是，這樣一款配置頂格、定價親民的走量車型，普遍預測價格將不到30萬。這意味着，AI時代的最前沿技術，將第一次變得如此觸手可及。

而當「大模型開車」不再是硅谷博主的特權，中國消費者也就終於等到了AI上車動真格、且買得到的時刻。

推廣

免責聲明：投資有風險，本文並非投資建議，以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請，作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考，不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證，投資者應自行研究並在投資前尋求專業建議。

老虎證券

AI Agent衝破螢幕，中國汽車人迎來自己的司機助理

熱議股票