DeepSeek开源加速理想9个月 李想:我们仍坚持自研基座模型

凤凰网科技
17 May

凤凰网科技讯 5月17日,理想汽车创始人李想近日在“理想AI Talk第二季”中,详细阐述了他对当前人工智能发展趋势的观察以及理想汽车在智能驾驶和AI领域的布局。他指出,在距离上次AI对话约130天的时间里,最令他高兴的是看到整个中国的进步,包括DeepSeek、千问等国内模型已将中国在基座模型、推理和多模态方面的水平基本拉近或与美国处在同一水平线上

李想认为,中国企业在模型效率方面做得更好,进行了深层工程改造,这增强了行业的信心。他特别提到,DeepSeek V3的混合专家模型(MoE)架构(671B参数)及其极简地运用“人类最佳实践”(研究-研发-表达能力-业务价值)的做法,令他受益匪浅。

李想坦承,尽管AI技术发展迅猛,但他个人的工作时长并未减少,反而在增加。他认为主要原因是,大多数人目前仍将AI视为一种信息工具。这种工具依赖联网搜索和检索增强生成(RAG),但信息源本身可能存在失真和不准确,导致推理过程和结果出现问题,甚至增加无效信息(熵增)。

他将AI工具分为三类:信息工具、辅助工具和生产工具。只有当AI真正成为生产工具,能够替代人类完成专业工作、解决最核心的8小时工作时间、产生有效生产力时,AI的价值才能真正爆发。他认为,未来的Agent(智能体)不会是通用的,而是每个专业领域都会有专业的Agent,因为不同领域的语料、行动和思维链是完全不同的。

对于DeepSeek的出现,李想给予了高度评价。他透露,DeepSeek的开源对理想汽车的自动驾驶研发产生了巨大帮助,特别是VLA模型中的语言(L)部分,加速了大约9个月的时间。正是因为DeepSeek带来了如此大的收益和帮助,理想汽车决定将自研了四年的整车操作系统理想星环OS开源,这是一种对社会的贡献和感谢,并非出于公司战略,而是源于一种朴素的情怀。

尽管拥抱了DeepSeek,但李想强调,理想汽车不仅没有放弃自研基座模型团队,反而加大了投入,仅训练卡采购量就比今年的预期多买了3倍。他解释说,这是因为理想汽车的业务场景特殊,车载环境需要针对性的基座模型,包括3D视觉、高清2D视觉(分辨率提升10倍)、交通/驾驶/家庭领域专业语料,以及视觉与语言联合语料。这些数据和场景是通用大模型所不具备的。理想汽车目前正在训练不同规模的模型,例如用于车载智能助手(理想同学)的约3000亿参数模型,以及用于辅助驾驶VLA视觉语言部分的320亿参数模型。

李想将理想汽车的智能驾驶发展划分为三个阶段:从规则算法阶段(昆虫智能),到端到端+VLM阶段(哺乳动物智能),最终迈入VLA(视觉、语言、行动模型)阶段(人类智能)。他将车载VLA称为“司机大模型”,目标是像人类司机一样工作。他认为,交通领域是实现VLA的最佳实验场,因为规则清晰、环境确定、车辆控制自由度相对较低,便于模仿学习和强化学习。VLA的训练流程复杂而系统化,包括预训练VL基座(整合多源数据,蒸馏到端侧)、后训练加入行动模块(模仿驾驶行为)、以及强化训练(通过人类反馈和世界模型训练,追求超越人类的平均驾驶水平)。

针对VLA将行动引入物理世界带来的安全问题,理想汽车专门组建了百人规模的“超级对齐”团队。这个团队的核心任务是确保即使模型能力很强,也能像一个职业司机一样,遵守交通规则、符合人类驾驶习惯、保证安全和舒适性,避免出现激进或不安全的行为。李想认为,这就像雇佣职业司机一样,除了驾驶技术,更重要的是其“职业性”,即价值观对齐。此外,为解决模型黑盒问题和提高验证效率,理想汽车构建了基于重建和生成的交通世界模型,可以在虚拟环境中模拟真实场景,进行高效、可重复的测试和问题解决。

李想表示,迈向VLA无法跳过端到端等前期积累,“无法直接吃第十个包子”。他强调扎实的基本功在AI时代尤为重要。理想汽车自2021年开始自研辅助驾驶,在操作系统、训练体系、底层芯片软件优化等方面都进行了深入投入。他认为理想的智驾在原创性上甚至超过了增程技术。面对行业竞争,他认为应学习顶尖公司的基本功,因为在AI时代,能力强的公司能很快复制创新,基础扎实才能应对挑战。尽管VLA是目前能力最强、最接近人类驾驶的架构,李想对其是否是效率最高的终极架构持开放态度。他也指出,对于ETC收费站这类确定性场景,使用规则算法比纯模型更高效、准确且成本更低。

回顾创业历程,李想认为最深刻的记忆是理想ONE和理想L9的成功发布,但也经历过产品发布后的低谷和质疑。他选择将这些困难视为成长的机会,并尽可能只保留有价值的美好记忆,以保持正能量。

在个人成长和能量方面,李想认为关键在于关注人,尤其是亲密关系,接受自己和别人的优点与不足,通过持续的成长来获取和传递能量。他看到了家人和团队的成长带来的巨大能量,并认为AI应帮助人类有更多时间与“万物”接触,获取智慧。最后,他表示AI时代应保留人性的所有特质,无论好坏,因为它们共同构成了生命的活力。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10