来源:盖世汽车 更新时间:2024-09-04 04:59:36 阅读量:16694
重感知无图的智驾方案减少了对地图的依赖,地图转变为增强感知能力的工具。无图方案能够助力城市开放,解决长尾场景问题,技术迭代方式由模块化向多模块融合转变,数据驱动与规则驱动相结合。
2024年4月17日,在第二届汽车人工智能大会上,一汽科技开发有限公司智能驾驶高级总监张悦提到,在重感知轻图方案中,感知是核心模块,采用BEV+transformer+OCC模型。静态感知能力是关键,通过融入导航交通信息提升感知能力。此架构合并了感知多模块,输出综合感知结果,为决策规划提供输入。
而决策规划基于规则与交互式时空联合优化迭代,需确保数据链路通畅以支持模型快速迭代。数据过程包括自采与量产数据闭环,实现模型初始化和长尾场景采集,并通过量产车回收关键数据。构建数据中心和示范中心时,需遵守测绘行为规定,确保数据安全和合规性。打通数据链路后,将进行模型与数据的迭代过程。
一汽科技开发有限公司智能驾驶高级总监
以下为演讲内容整理:
红旗智能驾驶业务介绍
一汽集团的研究团队在南京和北京分别设立了人工智能研发中心和软件中心,其中南京中心主要负责智能驾驶技术的研发工作。自2020年6月南京公司成立起,团队便致力于自主技术的研发,包括云管端和云平台的创新,以及从L3级别以下智驾技术的量产交付。同时,团队也前瞻性地探索L4级别的技术。目前,团队已在L4级别迭代了三种车型,并成功获得了多个城市的自动驾驶试运营牌照。预计从2022年6月起,我们的智驾技术将陆续在量产项目中得到应用。
图源:演讲嘉宾素材
2024年3月,我们红旗品牌推出的自主新能源车型EH7上市,搭载了一系列先进的自动驾驶辅助功能,包括大家熟知的AEB、LKA、EMA、ACC等功能。这些技术的核心研发工作正是由我们的南京团队完成的。展望未来,我们计划在未来几个月内陆续推出更高阶的智能驾驶功能。
红旗智能驾驶关键技术路线
接下来,让我们聚焦于无图自动驾驶技术的研发路线。过去,我们在高速领航自动驾驶功能中主要依赖高精地图来提升智驾能力,这样做是为了利用地图的详细信息来减轻算法负担,并降低适配时间和技术成本。然而,随着智驾产品的不断迭代和用户需求的扩展,我们面临着新的挑战。
图源:演讲嘉宾素材
引入高精地图后,我们早期非常依赖其定位能力来获取环境的静态信息,并结合动态感知能力进行辅助。然而,随着用户期望智驾功能在更多场景下应用,如城市道路,我们面临着巨大的成本挑战。高精地图的扩展需要巨大的投入,不仅高速公路地图的购买成本高昂,城市内部道路信息的获取更是成本倍增。此外,高精地图的时效性也是一个不可忽视的问题。高速场景变化相对低频,但城市环境则变化频繁,这对高精地图的准确性和时效性提出了更高的要求。
因此,我们面临着两个主要问题:一是高精地图的成本问题,二是其时效性问题。为了解决这些问题,我们有两个必然的技术出路。首先,我们需要减少对高精地图的依赖,虽然低成本的地图信息仍有一定的利用价值,但我们的目标是不再过分依赖高精地图。其次,我们需要提升感知能力来弥补对地图的依赖。这与行业内提出的“重感知、轻地图”的理念相契合。
基于以上分析,我们规划了新的技术路线。一方面,我们仍会保留一部分高精地图的使用,但将更多依赖感知能力来处理动态场景,静态场景的感知则部分交由地图来完成。然而,这种方案存在局限性,如高精地图覆盖不足、不支持某些场景等。另一方面,随着智驾能力的提升,我们需要转向一种重感知、无图的智驾方案。这种方案将大大减少对地图的依赖,地图的作用将转变为增强感知能力。
此外,随着无图方案的实施,我们将具备更强的开城能力,解决过去一年里友商在开城方面遇到的难题。同时,这种方案也将使我们能够更好地应对未来可能出现的各种长尾问题。在技术实现上,这种方案将使得技术迭代更加模块化,模型的占比将逐渐增加,而规则占比将逐渐减少,实现数据驱动与规则驱动相结合的方式。
关于端到端的智驾方案,近期在行业内引起了广泛关注。经过深入分析,我们可以预见其具备三大显著特点:
第一,端到端的智驾方案通过构建简洁明了的技术架构,实现了从原始数据到最终车控信号的统一处理。这种“弹幕块”的设计理念,使得整个系统更为透明与高效,为智驾技术的发展注入了新的活力。
第二,当系统采用单一的模块架构化设计时,信息的无损失传递成为一大优势。这种设计确保了从头到尾的信息一致性,为智驾系统的稳定运行提供了有力保障。
第三,端到端的智驾方案完全依赖于数据驱动,这无疑是其一大亮点。然而,这种方式对基础设施的完善程度以及对问题的深入理解提出了更高要求。目前尚无法确定这种方案在产品表现上是否优于重感知无图的方案,这需要我们进一步探索与实践。
在重感知轻图方案中,感知模块的核心地位不言而喻。当前行业内普遍采用BEV+transformer+OCC的模型架构,这一趋势已经日益清晰。值得注意的是,BEV的静态感知能力在不依赖鲜艳知识地图的情况下显得较为薄弱,因此提升其对环境的感知能力成为技术迭代的关键方向。通过融入导航交通信息等额外信息,我们可以有效增强感知模块的能力。
在实际应用中,我们已构建了BEV+transformer+OCC架构并将其部署于车辆之上。这一架构实现了感知多模块的合并,包括融合与定位等功能,从而输出一个全面的感知结果。这将为下游的决策规划提供有力的数据支持。
决策规划方面,我们目前采用基于规则的方式与交互式时空联合优化方式进行迭代。为确保模型的快速迭代及未来发展方向的正确性,建立畅通的数据链路至关重要。
我们还关注整个数据过程,包括数据自采与量产数据闭环两个方面。通过搭建一致性采集车进行数据搜集,我们实现了智驾模型的初始化过程,并提升了模型的基本能力。同时,通过量产车回传关键数据进行数据回收,我们不断完善和优化模型。此外,我们还构建了整体的数据中心和示范中心,以支持数据大模型的链路打通。需要注意的是,由于自动驾驶车的采集行为已被定义为测绘行为,因此整个数据中心和智算中心需在严格的监管下进行。
大模型与红旗自动驾驶技术结合
作为研发团队,我们深知大模型在实际应用中的价值。第一,大模型能够显著提升自动化标注能力;第二,场景仿真和生成能力对于自动驾驶技术的发展具有重要意义;第三,大数据基建的持续投入对于模型的提升同样不可或缺。
在技术架构方面,我们关注到transformer这一大模型技术架构在NLP领域的广泛应用,并注意到其在计算机视觉领域尤其是自动驾驶领域的巨大潜力。通过关注视觉大模型应用,我们不断拓展视野并提升技术水平。例如,2023年我们关注到了sam这一开源大模型,并针对其进行了专业性的应用改进和工具配合。
此外,我们还注意到标注工作的泛化性在解决不同城市交通规则等非标场景中的价值。这种泛化性不仅帮助我们解决了实际问题,还为长期的迭代发展提供了可能。同时,我们也关注到Sora这一根据文本描述生成视频的人工智能模型,尽管其技术尚不成熟,但其在智驾仿真问题解决方面的潜力值得我们持续关注。
最后,我们需要认识到大模型的特点之一是依赖于数据量的大小。因此,如何获得大数据并对其进行有效应用成为了一个亟待解决的问题。相信在未来的发展中,众多团队都会关注并致力于解决这一问题。
首先,关于如何获取大数据,我们主要通过量产手段和自采数据的方式实现数据闭环。在此过程中,我们建立起一个数据中心,并借助先进的大模型技术,以解决长尾问题并推动现有自动化工具,如分割、标注等的迭代升级。这是一个正向的循环过程,通过不断地数据积累和模型优化,我们的技术水平得以不断提升。
图源:演讲嘉宾素材
同时,我们也借助类似Sora的生成和预测场景方式,增加整个场景构建的丰富性和多样性。最终,我们建立一套全面的评价体系,该体系涵盖了舒适度、安全性、场景适应性以及交通规则遵守情况等多个方面,以此作为内部评价准则,用于实现单一技术的迭代以及多模型之间的对比功能,进而推动整体技术策略的迭代升级。这是当前我们确定要执行的重要任务。
我们明确了技术路线的发展方向,即从依赖高精地图逐渐过渡到无需高精地图的端到端智驾方案。具体来说,高精地图的方案更多地应用于智驾量产的初始化阶段,许多企业已经或即将完成这一阶段的过渡。在这个阶段,智驾系统主要实现高速NOA功能,但应用范围相对有限,技术架构也较为松散。
接下来是无图阶段,这一阶段要求我们重构感知模块,实现更多信息的聚合。这是技术成熟的关键阶段,其技术路线表现为多模型的合并,逐步向端到端路径演进。
最终阶段是端到端的智驾方案,这代表着技术的完美实现。然而,技术完美并不一定意味着经济实惠,因此,我们需要在无图技术成熟方案稳定运行相当长一段时间后,再逐步过渡到技术完美阶段。
此外,关于大模型与自动驾驶技术的结合,我们提出以下观点:尽管目前尚未发现更多应用方案,但我们坚信大模型是推动自动驾驶技术发展的有效手段之一,其潜在价值巨大。因此,我们应坚持长期主义,持续探索这一领域。同时,AI技术的发展离不开模型和数据两个方向。我们期望在相对稳定的时间内,通过迭代优化达到稳定的模型状态,并基于该模型逐步建立数据体系,使数据驱动的比重逐渐增大。这是一个逐步推进和逼近理想状态的过程。最后,大数据的基础设施建设至关重要,我们将持续投入并推动这一领域的发展,同时期待与整个行业共同合作,共建共享成果。
科技开发有限公司智能驾驶高级总监张悦于2024年4月17日-18日在第二届汽车人工智能大会发表的《红旗基于无图自动驾驶的关键技术路线》主题演讲。)
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。