当前,汽车的智能化已然成为厂商必争的焦点。5月7日,理想汽车召开 “理想 AI Talk 第二季” 技术发布会,翌日,智能焕新版的理想L系列车型上市。在为期两天的时间里,理想汽车再次以硬核技术向行业宣告其持续锚定智能化转型的决心。
AI Talk第二季中揭晓的VLA视觉语言行动模型,与L系列智能焕新版的硬件迭代形成技术共振,不仅重构了人车交互范式,更在自动驾驶领域树立起新的技术标杆。这场由算法革命与硬件升级共同驱动的智能化跃迁,正将理想汽车推向“人工智能汽车化”的战略新高度。
理想AI Talk第二季中,重点介绍的 VLA 司机大模型系统无疑是最大亮点。理想汽车将其定义为面向交通领域的专业生产工具,目标是实现接近人类司机水平的自动驾驶功能。
过去130天,中国AI领域发生了标志性事件,即DeepSeek V3开源,以671B参数的MoE架构,在训练效率、推理成本、多模态能力上实现全球领先,其开源策略直接推动行业技术平权。
在访谈中,理想汽车董事长兼CEO李想多次提到 DeepSeek 对理想汽车在 AI 研发上的重要影响。他认为从 DeepSeek 身上学到了非常重要的一点,即DeepSeek极简地运用了 “人类的最佳实践” 来构建强大的 AI 模型,背后有着清晰的方法论,先做研究,再做研发,然后进行能力表达,最终将能力转化为实际业务价值。
基于DeepSeek的开源成果,理想汽车将VLA端到端模型的研发周期缩短9个月,计划于2024年9月推出具备3D视觉、高清语义理解、专业交通场景适配能力的多模态大模型。
然而,尽管有了DeepSeek这样强大的开源模型,理想汽车仍决定继续做基座模型,这与理想的业务需求紧密相关。理想汽车的业务不仅仅是做好语言模型这么简单,车上需要实现对话功能,并且涉及多模态应用,这就需要根据自身需求训练一个专属的基座模型。
事实上,从技术演进路径来看,理想汽车展示了清晰的三阶段发展路线。
早期的2021-2022 年,是基于规则算法与高精地图的辅助驾驶系统,这种模式就如同昆虫的条件反射,只能依据预设规则做出简单反应,面对复杂路况往往力不从心。
到了2023-2024年,端到端架构结合视觉语言模型(VLM)的辅助驾驶系统登场,实现了更灵活的环境感知,可依旧受限于通用模型的专业性与交互能力。
而如今2025年推出的具备多模态感知与决策能力的 VLA(视觉语言行动)司机大模型,宛如人类智能般,通过3D/2D视觉融合+思维链推理,完整复现人类驾驶决策链条,既能精准识别物理世界,又能通过自然语言交互理解复杂指令。
为了打造这一强大的VLA系统,理想汽车采用了三阶段训练机制。在预训练阶段,通过超300PB 的2D/3D视觉数据与交通语料构建基座模型,为系统奠定坚实的认知基础,就像是让一个孩子广泛地学习各种知识。
后训练阶段,引入动作编码数据与短链条思维链推理技术,使得系统能够掌握博弈与预判,比如在拥堵路段能像老司机一样预判他车轨迹,实现灵活变道,这就如同孩子开始将所学知识运用到实际生活中,学会应对各种复杂情况。
强化训练阶段,则运用RLHF与世界模型仿真技术进行安全校准,为模型植入职业司机底线思维,杜绝加塞等危险行为,保障驾驶的安全性与舒适性,这一步如同教导孩子要遵守社会规则,培养良好的行为习惯。
在安全性验证方面,理想汽车也下足了功夫。组建超过 100 人的安全对齐团队,构建覆盖全要素的交通世界模型,累计完成超 1000 万公里的虚拟仿真测试。
通过这些举措,最大程度地确保VLA系统在实际应用中的安全性。在硬件适配方面,技术团队通过自研推理引擎,实现INT4量化技术使Orin-X芯片支持语言模型运算,Thor-U芯片与双Orin-X芯片实现算力均衡,让硬件更好地为软件服务,发挥出最大效能。
商业世界的规律往往充满不确定性,纵观消费电子、汽车等领域,世界上没有一个爆款的诞生是可规划、可预期的。就像智能手机行业,当年苹果iPhone的横空出世,并非提前精准规划的产物;汽车领域特斯拉Model 3的爆火,也超出了最初的市场预期。
爆款的诞生,更多的是企业在把每一个环节尽可能的做好,在漫长的积累中,等待那个属于市场的 “奇点时刻”——当技术、需求、时机完美契合,一款产品便如星火燎原般引爆市场。而此次理想L系列智能焕新版的发布,或将成为理想汽车在智能化赛道上的关键 “奇点时刻”。
理想L系列智能焕新版全系迎来辅助驾驶芯片升级,AD Pro(辅助驾驶)搭载新一代地平线征程®6M芯片,AD Max(高级辅助驾驶)搭载NVIDIA Thor-U芯片,成为全球首个大规模量产交付NVIDIA Thor-U芯片的高级辅助驾驶平台,拥有700TOPS的算力。
今年下半年,理想汽车将为AD Max平台带来新一代VLA司机大模型方案,同时支持Thor-U芯片和双Orin-X芯片,将实现语音驾驶指令执行、漫游找车位、拍照位置识别代驾等高级辅助驾驶功能,与司机大模型沟通就像与人交流一样便捷。
同时,全系标配ATL激光雷达也是一大亮点。激光雷达在智能驾驶中起着至关重要的作用,即便在夜间人眼和视觉传感器难以看清的弱光、逆光、无光等复杂环境中,它仍能提供稳定的环境感知。AD Pro搭载新一代地平线征程®6M芯片后,算力更强,支持视觉与激光雷达数据融合,可在高速 120km/h 下实现夜间事故车 AEB刹停,夜间儿童鬼探头AES避让和夜间两台事故车AES连续避让。
当然,在智能座舱方面,全新理想同学也变得更可爱、贴心且强大。新增毛绒形象、微表情和微动效,支持自定义形象;首创记忆能力,升级后的账号系统可记忆家人的外貌、声音等特征,能智能切换专属坐姿、驾驶风格与桌面布局等;具备 Agent(智能体)能力,可处理点餐、订座、买票等车外任务。
这些智能化的提升,不仅增加了用户与车辆的互动乐趣,也让出行变得更加便捷高效,进一步体现了理想汽车在智能化领域的深入探索。
无论是理想 AI Talk 第二季发布的 VLA 司机大模型,还是理想 L 系列智能焕新版在辅助驾驶、智能座舱等方面的升级,都反映出理想汽车在寻找新的技术锚点,旨在构建更加完善的智能化体系。
从整体来看,理想汽车在智能化布局上有着清晰的思路。在智能驾驶方面,持续投入研发,提升自动驾驶的安全性和可靠性,逐步实现从辅助驾驶到自动驾驶的跨越。在智能座舱领域,不断优化用户体验,增强人与车之间的交互,打造更加人性化的智能空间,同时,通过硬件与软件的协同发展,实现车辆整体智能化水平的提升。
未来理想汽车还将在智能化道路上继续前行。随着VLA大模型量产上车,计划在2026年前实现城市NOA全覆盖,并探索 “人车共驾” 混合智能模式。此外,理想汽车也将不断拓展智能汽车的应用场景,比如在智能充电、车联网等方面进行创新,为用户提供更加全面、便捷的出行服务。
在这场由VLA架构与L系列焕新共同驱动的智能化革命,理想汽车正以“司机大模型”为支点,撬动自动驾驶从“工具”向“生产工具”的进化。或许对于李想来说,相比造车,李想的理想是在“造司机”。
更新时间:2025-05-13
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号