三湘都市报9月19日讯(全媒体记者 李致远)在现代交通环境中,驾驶者常常面临信息盲区的挑战:在复杂的路口穿梭时,只能看到眼前的车流,却无法预知百米外哪个车道即将拥堵;在畅通的高速上行驶时,却难以预见前方因轻微刹车而引发的“幽灵堵车”。 这些局部视角的限制,使得驾驶者难以做出最优的决策。为了应对这一难题,高德导航依托空间智能架构,实现了TrafficVLM模型的再升级,从而助力用户实现全局交通掌控,提升驾驶体验。
TrafficVLM的核心能力在于“让AI看见实时交通”
依托空间智能架构,全新升级的TrafficVLM(交通视觉语言模型)为用户带来了前所未有的“天眼”视角。这项技术能让用户全面了解全局交通状况,从而在复杂环境中做出更优决策。它赋予每位驾驶者“全知视角”的能力,在面对路口或高速时,不再受限于局部视野,从而更直观预知前方路况,从容应对潜在风险。
当用户开启高德地图导航,一场智能化出行的序幕已拉开,但在用户看不见的云端,TrafficVLM也在同步运行,并以分钟级的频率持续对沿途交通态势进行实时推理,化身用户的超视距“天眼”。
(图:TrafficVLM赋能的AI领航)
例如,在用户前方3公里的主干道上,左侧车道因一起突发追尾事故而形成新堵点,即时TrafficVLM会通过实时孪生交通感知到了这一异常,且推理识别出事故点并洞悉其发展趋势:拥堵或将快速蔓延,形成一个长达3公里的拥堵路段。为此,TrafficVLM会迅速生成最优决策建议。在用户到达拥堵点之前,及时推送通行建议:“前方三公里突发事故,大量车辆向右并线,推荐您提前靠右行驶,注意避让应急车辆。”
这不仅仅是一条文字提醒。当用户点击导航界面右下角的视窗,导航画面瞬间切换,仿佛一部拥有上帝视角的摄影机,跨越3公里直抵拥堵现场,实时呈现前方车流动态与高清实景图像。通过云端调度系统的快速响应,系统在拥堵发生时即刻下发观测指令,调取第一现场的视觉数据,并基于图像中的深度信息进行智能分析,精准还原拥堵点位的空间结构与交通态势。用户不仅能直观看到“前方堵车”,更能清楚理解为何需要变道、何时该减速,以及拥堵的真实成因与范围。这种从被动接收提示到主动洞察全局的转变,让用户摆脱了“盲人摸象”般的局限,真正实现了对复杂路况的可视化、可感知、可预判的智慧导航体验。
据高德地图产品负责人介绍,其团队构建了一套强大的底层系统——交通孪生还原能力,能够在“任意地区、任意尺度”下,将海量的实时交通数据精准还原为动态孪生视频流。无论您身处繁华的北京国贸桥路口,还是狭窄的广州老城小巷,都能实时构建出一个与现实世界完全同步的“数字交通世界”,并将其以视频形式呈现。这些让交通视频流成为TrafficVLM模型学习、分析和决策的独特输入,让AI得以实时洞察现实世界中任意区域的交通脉搏。
从感知到决策:TrafficVLM的智能闭环
与通用视觉语言模型不同,以业界领先的视觉语言模型通义Qwen-VL为底座,TrafficVLM基于高德海量、高度还原的交通视觉数据,完成了强化学习和数据训练。首先,其需要适配地图和交通孪生还原这种独特的视觉模态,对交通元素具备语义理解能力。进而再进一步学习复杂的交通分析任务,并实现对交通动态的全面理解与预测。
TrafficVLM的能力覆盖了交通分析的整个流程,从感知到决策形成了一个完整的智能闭环。首先,它能够精准识别车辆、车道线、交通信号灯状态以及车路的相对位置;此外,它还能够深入分析车辆间的互动关系:例如一辆车正在犹豫是否变道,或前方车流的减速正在向后方传导。TrafficVLM可结合当下交通流及历史交通动态,分析拥堵成因和未来发展趋势,最终生成最优的决策建议,为用户提供全局视角的支持。
导航的终极目标,从来不只是提供一条抵达线路,而是确保每一次出行都兼具安全与效率。TrafficVLM通过“交通孪生还原”与“视觉语言大模型”的创新结合,重塑了导航的可能性。它让导航得以进化为能够主动感知、理解并提供全局最优决策的智能体,将复杂的交通博弈化繁为简,变成用户可以直接了解的信息和决策建议。这不仅标志着高德地图在导航领域与大模型技术深度融合,还体现了其在AI主动参与决策能力方面的突破与创新。
更新时间:2025-09-20
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号