AI Agent衝破螢幕,中國汽車人迎來自己的司機助理

虎嗅APP
昨天

艙駕融合,是汽車智能化由情緒價值向實際價值變化的關鍵點。

車企們卷螢幕尺寸、卷語音包的擬人度、卷氛圍燈的呼吸頻率。所謂先進的智能座艙,總是逃不開「情感陪聊」或「解壓空間」的範式,你可以在車裏刷劇、唱K、用語音開關下車輛功能。

但在最核心的出行邏輯裏,它依然是一個腦肢分離的半成品,座艙管你的心情,智駕悶頭開車,兩者老死不相往來,唯一有關聯的,是螢幕上的導航和3D模型。

這種分裂導致了一個尷尬的現實:所謂的智能,並沒有幫你解決掉任何實質性的麻煩。你想去接孩子順便買束花,智艙模型聽的懂你的意圖,卻指揮不動底盤和智駕系統。最終,你還是得在「情緒大腦」和「執行身體」之間充當那個卑微的人肉協調員。

根據麥肯錫出具的《中國汽車消費者洞察》,儘管智能化配置日益奢靡,但超過70%的車載App在提車三個月後即陷入永久沉睡;雖然高階智駕(NOA)的購車意向率高達80%,但用戶在大多數時候依然選擇「親自上陣」。

特斯拉的Grok+FSD給出了版本的前瞻答案。馬斯克的邏輯依舊第一性原理:理解世界的大模型(Grok)和大模型驅動的智駕系統(FSD)直接打通,把汽車從電子產品直接變成具身智能

從在美國的測試體驗來看,這套方案確實驚豔:只需要用自然語義表達自己的出行目標,特斯拉會自動規劃目的地,並給到自動駕駛和語義的雙反饋。

但這套方案畢竟高度垂直,在中國這個更開放也更多元的智能化場地,誰能把這套邏輯真正工業化落地?

合併汽車的左右腦

2025年7月,馬斯克宣佈Grok登陸特斯拉。最初外界以為這只是給車裏換了個更聰明的語音助手,但很快,北美第一批拿到的用戶發現這事兒變了味。

當你按住按鍵說出:「帶我去公司,順便路過那家我常去的咖啡店,電量如果不夠撐到終點就提醒我。」

從本質來看,這是在給整車下達一個複雜的「複合任務」。背後的邏輯是:Grok解析語義,同時調取你的歷史軌跡(常去店址),選擇對應的咖啡店,基於實時路況、電池剩餘電量以及FSD的行駛路徑規劃,形成一個「任務規劃」而非「導航路線」

而特斯拉不僅能做到,還能不斷地根據最新的路況和現實情況進行調整,它讓汽車從一個被動的「執行工具」變成了一個主動地「司機助手」。

英偉達專家Jim Fan,這位英偉達人形機器人通用模型Project GR00T的領軍人物,激動地將這種體驗稱為「物理圖靈測試」的雛形——因為你分不清開車的到底是一段代碼,還是一個極度懂你的老司機。

這種「張嘴即可得」的爽感,本質上是把大模型從「聊天的螢幕」裏拽了出來,直接塞進了智駕的「執行層」。這中間有大量的兼容和適配要做。

以前車裏的座艙和智駕,像兩個完全語言不通、甚至辦公地點都不在一起的部門:智艙跑的是安卓系統,求的是生態熱鬧;智駕跑的是QNX,求的是絕對安全可靠。

要把大模型塞進「執行層」,本質上需要給整車打造一門「通用語言」,解決掉複雜的底層通訊協議的延遲,更難的是任務拆解和翻譯」。

大模型需要把模糊的人類語言,瞬時並精準的翻譯成線控底盤和智駕系統能聽懂的指令。以往智艙只能看App的數據,智駕只能看攝像頭的數據,現在的邏輯是:模型能同時調用視覺信息、地理位置、剩餘電量甚至你過往的駕駛習慣,並把這些碎塊化的數據,拼成一個完整的行動邏輯。

3月18日,智己發布了IM Fusion Nova架構,成為國內首個通過大模型實現「艙駕融合」體驗的解決方案。同時有別於特斯拉高度垂直封閉的自研體系,智己以一種更開放的姿態,接入了全球目前最強的開源大模型——阿里千問。

這個在春節期間靠着「一句話跨App下單外賣」刷屏的大模型,上車後的角色從「電子寵物」變成了「首席執行官」。在Fusion Nova的邏輯裏,千問不再只負責文字回覆,而是直接生成「任務流」。

當你說出「帶我去接娃順便買花」這種複合意圖時,它不僅能夠自動調取高德導航規劃最優路徑,同步指令給智駕模型啓動路線,更能聯動支付Agent完成鮮花挑選和預訂,並讓智駕在接娃點和花店路邊精準靠停。

這種Intent to Motion(意圖即動作)的閉環,標誌着汽車真正從「加上螢幕的交通工具」,向着「四輪機器人」啓動進化。

線控,AI上車的標配

如果說大模型是智己的「大腦」,那麼線控底盤就是它的「神經中樞」。這也是區分真智能與「僞智能」的一道分水嶺。

過去一百年裏,人類對駕駛的感知是極其模糊的:你憑感覺踩剎車,憑經驗打方向,所謂的「操控性」本質上是人類神經系統對機械慣性的被動妥協。但血肉之軀的反應時延通常在200-300毫秒,且人類無法感知四輪抓地力在毫秒間的微觀變化。

AI一旦上車,這個問題的複雜度就要再上一個級別:傳統的機械底盤操控,根本配不上現在的AI算法。

你以為智駕算法跑得快就夠了?但在工業時代的傳動軸面前,AI的算力就像被困在螢幕裏的殘疾人。如果底盤的「反饋神經」還停留在液壓泵和機械拉索上,那麼算法預判得再準,落到輪端執行時也已經成了延遲極高的「馬後炮」。

為什麼說智己讓大模型開車是認真的?因為他們直接掏出了全線控的「靈蜥數字底盤」。

線控以前更多的停留在實驗室,只有特斯拉Cybertruck、蔚來ET9這樣極少數的技術圖騰上。有的為了追求純粹的技術溢價,有的為了展示整車架構的顛覆性。

而智己的邏輯更直接,它只是為了給AI找個好身體,通過IM Fusion Nova架構,無論是人的駕控還是AI的指令,僅需20毫秒即可完成信號傳遞到動作執行,較傳統轉向快4倍以上,並有三重安全冗餘確保其幾無失效可能。

大模型+線控底盤,徹底跳出了人類「模糊車感」的侷限,智己完成了全車從操控到執行的全數字化,線控底盤和大模型能以人類無法企及的精度,尋求每一秒出行駕駛和乘坐體驗的最優解。

這不只是體驗的升級,更是通向L3、L4的物理基石。業內公認,2026年將成為「線控元年」,也將是L3的爆發之年。在這個節點上,智己開始靈蜥3.0的應用,已經開始通過大規模量產,為下一代實現徹底智能化的車型做好了準備。

畢竟,沒有線控底座的智駕,只是在拙劣地模擬人的操作;有了線控底盤的具身智能,纔是真正意義上對駕駛主權的物理接管。

看得到,不如買得到

大模型上車,有一個繞不開的技術悖論:大模型(LLM)天生自帶「幻覺」,它偶爾會一本正經地胡說八道。如果你把駕駛權交給一個可能「胡言亂語」的AI,這事兒聽起來像是在玩命,這也是Grok+FSD現在仍然只停留在測試的原因。

智己直面並給出了行業示範的解法,叫非對稱式安全護欄。座艙裏的大模型擁有極高的「創意權」,它負責去理解那些發散的、模糊的人類意圖,但涉及到控車的物理決策,則回到了擁有L4級能力,只講規則的異構安全域。

再直白點講,大模型負責「出主意」,但最終「能不能做」以及「怎麼做」,必須經過安全規範的邏輯二次校驗,它解決了大模型不確定性與駕駛絕對安全性之間的矛盾。也是智己敢於即將在量產車型中實際應用這套「大模型」方案的底氣。

即將在3月26日開啓預售的智己LS8,將首搭IM Ultra Agent 1.0版本。這就意味着,LS8將成為「千問大模型全球首個上車+L4級智駕能力+線控數字底盤」的一台車。

在智己的內部版圖裏,LS8的角色非常關鍵,向上與去年上市的LS9組成「雙旗艦」,負責站住技術天花板;向下又與LS6構成「銷量雙子星」,負責在主流市場收割訂單。而AI大模型首發搭載,顯然是看中了LS8的獨特定位。

馬斯克的Grok+FSD展現的是一種封閉的、高度垂直的英雄主義路徑——這套邏輯確實迷人,但也極其排他。

而在中國這個捲到極致、生態複雜的智能化場地,智己跑通的是一條更具產業參考價值的「生態協同方式」:接入阿里成熟的Agent生態(支付寶、高德、飛豬),再配合上汽70年的製造積澱,讓專業的仍然各自屬於專業,而各自的進化都將為車型這個「交叉點」帶來更多可能。

過去的一年,中國車市瘋狂「卷9系」,各大廠都在不計成本地堆砌技術圖騰。而2026年,行業的戰火註定將延燒至更具普適性的「8系」戰場。在新戰局開啓的前夜,智己LS8憑藉「全線控靈蜥底盤+艙駕融合大模型」的雙重護城河,已經提前佔領了技術高地,鎖定了「2026年最值得期待的8系旗艦」的一席

更具殺傷力的是,這樣一款配置頂格、定價親民的走量車型,普遍預測價格將不到30萬。這意味着,AI時代的最前沿技術,將第一次變得如此觸手可及。

而當「大模型開車」不再是硅谷博主的特權,中國消費者也就終於等到了AI上車動真格、且買得到的時刻。

推廣

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10