全文刊载于《前瞻科技》2025年第2期“地面运载工程专刊”。
文章摘要
智能驾驶技术作为提升交通安全与效率、推动汽车产业革新的核心领域,已进入高级别自动驾驶量产应用的关键阶段。文章系统梳理了智能驾驶技术的发展历程,从硬件支持系统(车载芯片、传感器、控制器、执行器等)、软件功能系统(操作系统、地图与定位、环境感知、预测决策、运动控制、仿真测试等),以及“端到端”自动驾驶系统(数据采集和标注、训练算法、模型架构、压缩部署等)3方面总结技术现状。揭示其面临的共性挑战:硬件能效与安全瓶颈、传感器融合精度不足、开放道路长尾场景泛化能力弱、大规模模型算力需求激增、仿真测试覆盖不足及数据安全风险等。未来技术将向硬件融合一体化、软件高稳定性与安全性、“端到端”车路云协同赋能方向演进。针对中国发展需求,提出加强硬件自主可控、构建国产软件生态、建立统一测试评价体系及推动“端到端”技术落地的对策建议,以期为高级别自动驾驶技术突破与产业化提供理论支撑。
文章速览
随着全球科技革命的演进,智能化已成为汽车工业技术变革的重要方向之一。其中,智能驾驶技术的发展使得驾驶主体从人类逐渐向机器智能转变,将对道路安全、交通效率和环境保护等方面产生深远的社会进步影响。智能驾驶技术通过全面的环境感知和高级别的智能决策控制,能够预先识别潜在风险,减少交通事故的发生,甚至有望实现交通事故的完全预防。此外,智能驾驶还可以通过优化行驶路径和维持适当的车距来提高交通运行效率,有效缓解城市拥堵问题。借助车辆、道路和云端的一体化协同工作,智能驾驶技术还能更加合理地规划行程,降低燃料消耗与尾气排放,为实现“碳达峰与碳中和”目标贡献力量。据预测,即使仅是普及以驾驶辅助系统为代表的初级阶段智能驾驶技术,也能使交通效率提升大约10%,同时分别降低燃油消耗和污染物排放约5%。因此,发展中国式汽车智能化、突破关键技术“卡脖子”问题已经上升到国家战略层面高度。
智能驾驶技术经历了多年的发展,并随着人工智能、深度学习、传感器技术等先进技术的快速演进,取得了显著成果。目前,智能驾驶系统已具备较强的环境感知、决策规划和运动控制能力,已经在高速公路等简单道路交通场景实现应用。然而,面对城市道路的复杂交通环境、多样交通参与者及强博弈交互行为,智能驾驶技术在泛化普及应用中仍然面临巨大挑战。为此,文章从智能驾驶技术的发展历程出发,介绍智能驾驶技术的发展现状,阐述智能驾驶技术面临的关键技术问题与挑战,并提出发展方向及建议。
1 智能驾驶技术的发展历程
智能驾驶指车辆通过不同类型的传感器实现对周边道路、行人、障碍物、路侧单元及其他车辆的感知,在不同程度上实现车辆安全、自主驾驶。根据GB/T 40429—2021《汽车驾驶自动化分级》,汽车自动化等级可分为L0~L5共6级,其中L0~L2为辅助驾驶,L3~L5为自动驾驶,其核心差异在于L3级以上自动驾驶统能够在其设计运行条件持续地执行全部驾驶任务。智能驾驶包含了全部所有的汽车自动化水平。一般来讲,智能驾驶系统包含有感知、预测、决策、规划、控制等多个子模块,经历了从规则式算法到深度学习驱动的模块优化,再到“端到端”架构的演进过程。
早期的智能驾驶系统采用模块化设计与规则式算法,各个模块功能明确、相互独立,单独进行功能开发最终组合形成驾驶系统。模块之间采用标准结构化的数据信息进行通信连接,主要基于人类对三维物理空间的定义,如障碍物的位置、朝向、速度、轮廓、区域划分、意图类别、未来轨迹等,便于模块开发和调试。然而,模块化的架构设计也同时带来信息传递延迟、信息丢失、系统全局协调性差等问题。
随着深度学习技术的发展,智能驾驶领域迎来了革命性变化,尤其感知和预测模块开始采用学习型方法并取得优异效果。卷积神经网络、鸟瞰图模型和占据网络在感知技术中引领潮流;循环神经网络和长短期记忆网络在轨迹预测方面成效显著;强化学习为序列决策提供新路径,集成式决策控制框架在动态决策中表现出色。然而,该阶段各模块仍保持独立性,信息传递基于人类对三维空间的理解,导致信息丢失和难以全局优化的问题仍然存在。
“端到端”自动驾驶是指从原始感知输入到车辆控制命令输出的模型全链路全部由深度神经网络承载,其中,全部模块的神经网络化是“端到端”自动驾驶的核心特点。采用包括数据采集和标注、模型训练、评估优化和压缩部署等环节的自动驾驶数据闭环迭代训练方法,能够实现自动化的全局优化,是迈向高级别自动驾驶的最具潜力路径。
2 智能驾驶技术发展现状
近年来,随着人工智能、深度学习、传感器技术等领域的快速发展,汽车智能驾驶技术在硬件支持系统、软件功能系统及“端到端”自动驾驶系统等方面取得了显著进展。智能驾驶的核心目标是通过全面的环境感知、精准的决策规划和高效的运动控制,实现车辆在复杂交通环境中的安全、自主驾驶。当前,智能驾驶技术已经从理论研究和实验室验证阶段逐步走向实际应用,并在特定场景下实现了商业化落地。然而,面对开放道路的复杂性和多样性,智能驾驶技术仍面临诸多挑战,尤其是在硬件能效、软件稳定性、系统泛化能力等方面仍需进一步突破。
2.1 硬件支持系统
智能驾驶的硬件支持系统架构如图1所示,主要包括车载计算芯片、传感器、控制器和执行器等。
图1 智能驾驶硬件系统架构
Fig. 1 Structure diagram of hardware system of intelligent driving system
1)车载计算芯片
车载计算芯片为智能驾驶系统提供了计算基础,随着计算需求的不断增加,车载芯片技术不断向高集成度、高安全性和高性能方向发展。
车载芯片的核心任务是为智能驾驶系统提供算力保障,在车载空间的限制下,采用高度集成化的设计,集成多核中央处理器(Central Processing Unit, CPU)、图像处理器(Graphic Processing Unit, GPU)、人工智能(Artificial Intelligence, AI)加速器及多个传感器接口,不仅减少了物理空间的占用,还大幅降低了功耗,也提升了系统的可靠性。同时,通过针对神经网络的适配性设计,车载芯片能够高效处理来自摄像头、雷达和激光雷达等传感器的数据,提升算法运行效率。
另外,车载芯片的安全性和可靠性要求也日益增加。芯片不仅要满足汽车行业的功能安全标准(如ISO 26262),还需要具备出色的信息安全性能,防止外部攻击和数据泄露。通过冗余设计和车规级认证,车载芯片的可靠性得到了显著提升,确保在各种环境下都能稳定运行。
国际上,英伟达公司(NVIDIA)的Orin平台集成了GPU与AI加速器,能够提供每秒数百TOPS的计算能力,满足高级别自动驾驶的需求。国内华为昇腾和地平线征程等芯片则通过优化AI算法和算力架构,逐步缩小与国际厂商的差距。此外,存算一体技术作为应对存储瓶颈的创新方案,提供了更高的能效和灵活性。
2)传感器
车载传感器是智能驾驶系统的“眼睛”,其性能将直接影响智能驾驶的安全性。典型的车载传感器包括摄像头、毫米波雷达、激光雷达等。
摄像头是环境感知的重要信息来源。现代车载摄像头对图像质量、稳定性和帧率等方面的要求不断提高,呈现出高清化、广角化、多目化和智能化的发展趋势。高清摄像头不仅可以提供更远的探测距离,还具备高动态范围(High Dynamic Range, HDR)功能,能够在强光或低光环境下提供清晰的图像。
毫米波雷达使用毫米波频段进行探测和测距,可以在雾、雨、雪等恶劣天气条件下保持较好的性能。目前,毫米波雷达技术的发展趋势主要体现在4D成像、数字编码和卫星架构等方面。4D成像雷达通过提供更高的角度分辨率,能够更加精确地识别目标物体的高度及静态目标。目前市场上的毫米波雷达以印刷电路板(Printed Circuit Board, PCB)微带天线为主,随着3D波导天线技术的发展,在损耗降低、通道隔离、阻抗带宽上表现更佳,也在热管理上优势明显。3D波导天线与雷达PCB分离的设计,更灵活、更紧凑,易于实现天线敏捷迭代开发。可以在规模化量产降低成本的同时进一步提高毫米波雷达的分辨率和探测距离。
激光雷达通过发射激光束并测量反射光的时间差或相位差来确定物体距离和形状的遥感技术,具有全向扫描及更高的分辨率、准确性,是智能驾驶领域的核心传感器之一,近年来在智能化、多维测量和芯片化方面取得了显著进展。未来,激光雷达将在多维测量与传感器融合、更高集成度光电芯片化等方向上继续创新。
3)控制器
控制器负责接收来自传感器的数据输入,并根据这些信息执行复杂的计算和决策过程,最终输出控制指令给执行器,以实现对车辆的精准操控。近年来,控制器在构架设计、通信技术、功能安全与网络安全等方面获得长足发展。
当前的智能驾驶控制器通常采用高性能的系统单芯片(System on Chip, SoC)作为核心计算单元,集成多核CPU、GPU、AI加速器等组件,以实现高效的传感器数据处理和复杂算法的实时执行。通过模块化设计,控制器可以根据不同的需求进行灵活配置,支持系统的扩展与升级。此外,车规级设计标准确保了控制器在恶劣环境下的稳定性和高可靠性。
高速车载网络是智能驾驶系统中控制器与其他硬件单元之间信息传输的基础。控制器通常采用以太网为主干网络,结合CAN-FD(Controller Area Network Flexible Data-rate)等协议来满足特定场景的通信需求。通过分布式通信协议和时间敏感网络(Time-sensitive Networking, TSN)技术,确保各传感器数据的同步处理和实时决策。此外,服务导向架构(Service-oriented Architecture, SOA)和时间戳同步技术在多传感器协同处理和数据融合方面具有重要作用。
此外,控制器的设计需要严格遵循功能安全标准ISO 26262,确保硬件和软件系统具备冗余机制,能够有效应对系统故障。此外,信息安全方面,控制器需要支持“端到端”加密与入侵检测系统(Intrusion Detection System, IDS),防止黑客攻击和数据泄露,保障智能驾驶车辆在网络环境中的安全。
4)执行器
执行器是将控制指令转化为实际机械动作的组件,直接负责对车辆进行物理操控。受益于新能源汽车快速发展,智能驾驶执行器已经逐步升级为以电控转向、电控制动和电控驱动为核心内容的线控底盘执行器。
电控转向系统负责识别驾驶员转向意图,通过电信号驱动转向器实现转向操作。人机协同转向中驾驶权的分配直接关系到车辆安全,是当前智能汽车需要解决的问题。L3+高阶自动驾驶安全标准和法规更严格,电控转向需要基于热备份的双通道冗余设计,实现供电冗余、感知冗余和执行冗余;针对纯电动分布式驱动车辆,基于轮毂电机驱动的新型主销式独立转向技术可以提高车辆的机动性和操控性。
电控制动系统负责识别驾驶员制动意图,通过电信号驱动制动器实现车辆减速,同时识别危险工况并主动介入控制。电控制动系统通常采用解耦构型,支持人机共驾与高阶智驾模式,精准执行驾驶员指令并反馈真实路感。系统智能自诊断与容错控制技术可以及时定位故障实现备份或降级制动,保障行车安全;实时判别车辆稳定性边界,通过制动力分布式高精度控制技术可以实现车辆动力学扩稳。
电控驱动系统负责识别驾驶员驱动意图,通过电信号控制车辆动力源输出行驶驱动力。目前以传统内燃机/单电机驱动+多挡传动为主。分布式四轮独立驱动系统自由度高、响应快、冗余强是乘用车的发展方向,提高系统集成度、动态响应和容错能力是关键挑战;多源多电机多档驱动系统模式多、工作范围宽、能耗优化潜力大是商用车的发展趋势,融合智驾信息降低车辆能耗和碳排放是系统关键技术。
随着新能源汽车电动化、智能化发展,线控主动悬架成为未来趋势。智能化的底盘悬架系统能通过传感器、控制器和执行器等组件实现实时监测和自动调节,从而适应不同路况和驾驶需求,提高驾驶舒适性和安全性。基于重新确定的智能车多维安全行驶控制包络和转向-制动-驱动-悬架稳定调控可介入区域的线控底盘一体化控制技术是提高特殊工况下车辆安全稳定的关键。
2.2 软件功能系统
面向智能驾驶软件功能系统的复杂性和实时性要求,智能驾驶技术面临理论与技术上的诸多挑战,主要体现在操作系统、中间件、电子地图与定位、环境感知、决策规划、运动控制和仿真测试等关键技术方面,其构架如图2所示。
图2 智能网联汽车操作系统架构
Fig. 2 Structure diagram of software framework of Intelligent and Connected Vehicle Operating System (ICVOS)
1)操作系统与中间件
智能网联汽车操作系统中的系统软件是为汽车场景定制的复杂嵌入式运行环境,主要包括操作系统内核和中间件。操作系统内核的研究主要聚焦于安全性和AI生态兼容性,主要包括Safety Linux和微内核实时操作系统(Realtime Operating System,RTOS)两种路线。其中,基于微内核的QNX(遵从可移植操作系统接口(Portable Operating System Interface, POSIX)规范的类 Unix 硬实时微内核操作系统,Quick UNIX)实时操作系统在市场上占据领先地位,但存在自主可控的问题。特斯拉则基于Linux内核自研全栈系统,但不对外开放。华为提供包括车载操作系统(Automotive Operating System, AOS)、自研芯片和移动数据中心(Mobile Data Center, MDC)控制器在内的全套解决方案。目前,随着技术的发展,多种内核方案正在不断融合,未来的车用操作系统可能采用结合宏内核与微内核优点的新型架构。
操作系统中间件由面向服务的应用框架、中间件库和服务组成。目前,面向服务的SOA已成为主流应用框架,中间件的研究可分为两部分:一是中间件库,提供系统接口函数,如消息通信、协议转换和文本校验;二是中间件服务,面向系统层提供安全稳定运行保障,包含状态监控、日志诊断和部署调度等模块。随着技术的不断发展,智能网联汽车操作系统将更加注重安全性、实时性和跨平台的兼容性,推动整个汽车产业的智能化和自动化进程。
2)电子地图与定位
用于智能驾驶的地图根据实际应用需求可以分为标准导航地图(无图)、高级辅助驾驶地图(轻图)与无人驾驶高精度地图(高精地图)3种技术路线,这些地图数据为智能驾驶系统提供了丰富、准确的环境先验信息。其中“无图/轻图/高精地图”是指对高精度、高鲜度道路信息地图的依赖程度高低。无图/轻图模式主要依赖感知设备进行环境信息采集和识别,使自动驾驶系统可以在没有高精地图覆盖或地图信息不准确的地区使用,在降低成本的同时也能够扩大自动驾驶系统的适用范围,但也对感知算法的性能提出了更高要求。
目前,智能驾驶地图的生产模式逐渐由专业采集转向以智能网联汽车为主的众源采集、云端AI成图、在线更新发布的模式。然而,低成本、高鲜度、安全兼顾的生产与更新仍然是目前亟待解决的关键难题。同时,智能驾驶地图汇聚了丰富的道路信息及车辆行驶轨迹数据,这些数据的安全性与隐私保护已成为亟待解决的关键议题。确保数据在传输、存储及使用过程中免受泄露与滥用的风险,保障数据的安全性,是当前面临的一项重大挑战。
高精度定位为车辆提供统一的时空基准,主要包括全球导航卫星系统(Global Navigation Satellite System, GNSS)差分增强定位、GNSS/INS(Inertial Navigation System, 惯性导航系统)组合定位、激光/雷达/视觉辅助数字地图匹配定位等。中国北斗卫星定位系统的成功研制与地基、星基增强系统的广泛部署,奠定了厘米级定位能力的卫星信号基础。然而,为了应对隧道、地下停车场等复杂场景定位需求,行业内正在聚焦视觉、雷达与地图的融合匹配定位技术。
3)环境协同感知
环境感知是智能汽车获取外界环境信息的根本途径,也是车辆自主行驶的基础和前提,其核心在于准确地理解和辨识自车与周边环境的驾驶态势。主流的智能驾驶车载感知系统大多配备了诸如可见光相机、激光雷达及毫米波雷达等多种类型的传感器,通过多传感器融合技术实现对周边环境的全方位综合感知。部分厂商模拟人类视觉系统的工作原理,采用无雷达、仅依靠视频图像数据的纯视觉方案实现环境感知,如特斯拉等,其优势在于能够大幅度降低硬件成本和部署复杂度,但由于摄像头受光照、天气等因素影响较大,纯视觉方案对算法和算力的要求较高。
有关车辆环境感知技术的研究最早可以追溯到20世纪80年代,以2012年为分水岭,此前的环境感知技术大多是手工工程与机器学习相结合的传统计算机视觉方法。2012年以后,基于深度学习的计算机视觉方法快速兴起,环境感知领域迎来了前所未有的革新。相比早期源于贝叶斯滤波定理的目标级融合方法,现有的数据级深度融合架构在原始数据层面实现了多模态信息之间的深度交互融合,进一步提升了感知系统的综合性能。
然而,由于计算机视觉方法的局限性及深度学习自身的固有缺陷,现有的感知模型仍然存在可解释性差、可信度低及泛化能力弱等不足,严重影响了环境感知系统在部分极端工况和罕见场景中的准确性、可靠性和适应性,仍需进一步探究。
4)行为预测与决策规划
行为预测和决策规划是体现自动驾驶智能性的核心模块。轨迹预测利用环境感知信息预判周围交通参与者的未来运动状态。当前的主流方法是采用“编码-解码”架构的神经网络。编码网络用于提取道路环境信息和交通参与者运动特征;解码网络用于输出多条预测轨迹及其概率;轨迹预测的核心难点在于学习异构道路拓扑和多交通参与者交互下的行为不确定性,实现长时域(5 s以上)的精准预测。
决策规划是结合全局行车目标、环境信息和轨迹预测结果,决定驾驶行为模式并对期望参考轨迹进行规划,经历了规则型、模仿型和类脑型3个发展阶段。规则型方案在场景预先分类的前提下高度依赖专家经验选择驾驶行为,难以覆盖所有可能工况且长尾效应显著;模仿型方案利用深度神经网络从大量人类驾驶数据中进行学习模仿,但要求海量全覆盖数据且无法超越人类能力;类脑型方案采用以强化学习为手段的探索式方法在与环境的交互中实现自学习和自进化,是高级别自动驾驶系统的未来方向。
5)运动控制
运动控制对车辆的位置、速度、加速度等参数进行精确控制,现阶段的主流方法以经典控制理论为基础,重点关注系统的稳定性与实时性,其代表性方法包括PID(
Proportional-integral-derivative)和模型预测控制(Model Predictive Control, MPC)。这些方法大多基于具有简单数学形式的显式控制律,适用于处理线性或准线性模型。因此,现有方案通常需对横向运动(如转向操作)与纵向运动(如加速、减速)解耦以简化控制器设计和计算复杂度,从而保证控制实时性要求。然而,这种解耦式控制策略缺乏对全局动态的整体优化能力,在复杂动态环境中表现出一定的适应性不足。随着智能驾驶系统感知与决策能力的不断提升,控制系统的灵活性与鲁棒性需求日益显著。运动控制正逐步由传统的模型驱动优化型控制向模型与数据融合驱动的学习型控制演进。学习型控制以神经网络为核心,将感知与决策层的推理结果作为输入,直接生成横纵向控制指令并连接车辆底层执行机构。通过控制层与上层决策的协同优化,学习型控制在复杂、多变环境下具备更强的自适应能力和鲁棒性,是当前行业的关注重点。
6)仿真测试
智能驾驶技术的进步依赖于虚拟仿真测试、封闭场地测试和开放道路测试的协同发展,其中,虚拟仿真测试因其高效性和经济性正成为主流。
当前,人工智能的技术突破已使仿真测试能够高保真地重构复杂场景,并通过仿真与实测结果的对比验证提升测试可靠性。高保真场景重构与泛化使得仿真测试能够覆盖更多复杂、极端的驾驶场景,增强系统的环境适应能力。仿真测试置信度验证通过比较虚拟与真实测试结果,逐步缩小两者的差距,从而提高测试可靠性。深度仿真方法与加速测试理论进一步优化了稀有事件的验证效率,大幅缩短了测试周期。此外,智能化的缺陷诊断方法能够快速定位系统的薄弱环节,为持续优化提供支持。
为了更好地结合虚拟与现实测试的优势,虚实融合测试成为重要方向。通过混合现实技术或虚实交互平台,开发者可在虚拟环境中测试真实车辆的性能。这种方法降低了物理测试的高成本,同时提升了仿真测试的真实性与置信度。随着虚拟仿真与现实测试的深度融合,智能驾驶测试将更加精准、高效,为技术迭代和规模化应用奠定基础。
2.3 “端到端”自动驾驶系统
以全模块神经网络化为特征的“端到端”自动驾驶系统,具备利用数据闭环进行快速更新的能力,为高级别自动驾驶的智能性提升提供一条全新的技术路径,其系统原理如图3所示。特斯拉FSD V12是“端到端”自动驾驶系统的典型代表,其特征是“影子模式”数据采集+“基于大模型的端到端”模型架构,采用模仿学习方法将算法迭代由“工程师的离线更新”推进至“车云协同的自动迭代”,从传统的单车智能模式转变为车云协同模式,是车路云一体化系统的初级应用形态。中国清华大学车辆学院团队几乎同时完成了国内首套全栈式“端到端”自动驾驶系统iDrive研发,包含感知(鸟瞰视角(Birds Eye View, BEV)网络)-预测(场景编码预测变换器(Scene Encoding Predictive Transformer, SEPT)网络)-决控(集成式决控(Integrated Decision and Control, IDC)网络)三段式神经网络模型,并已成功进行了实车部署和开放道路测试,引领行业“端到端”自动驾驶技术发展变革。未来,车路云一体化面向车的服务能力可完全覆盖并超越车云协同模式,通过具备海量性、完备性与可靠性特征的车路感知数据的跨域共用,实现自动驾驶算法和模型的大数据优化,可在大幅降低对车端感知的依赖和车辆成本的同时,为决策行为提供了上帝视角,突破人驾局限。
“端到端”自动驾驶系统的核心技术主要体现在数据采集标注、训练算法、模型架构、压缩部署和大模型整合5个方面。
图3 “端到端”自动驾驶系统原理
Fig. 3 Schematic diagram of “end-to-end” autonomous driving system
1)数据采集和标注
“端到端”自动驾驶模型依赖数据闭环来实现算法性能持续提升,数据闭环关键技术分为数据采集、数据挖掘、数据标注和数据生成。众源数据采集方面,通过多车型、跨车路异构多模态传感器采集自然驾驶场景数据,并满足时空对齐精度要求。边缘数据挖掘方面,通过知识与数据驱动方法,挖掘高价值驾驶场景数据,构建“共建、共享、共用”场景库。数据高精标注方面,通过多车型、跨车路异构传感器场景重建构建统一表征模型,基于多模态模型自动化学习端到端自动驾驶模型数据标签。数据高质生成方面,通过构建动静分离可组合的三维资产库,实现场景的泛化增强及数据的可控生成。
2)典型训练算法
“端到端”自动驾驶训练算法旨在通过数据闭环建立原始传感器输入到驾驶规划控制指令的映射,提高自动驾驶系统的性能和安全性,主要分为模仿学习(监督学习、行为克隆)和强化学习两类。监督学习的本质是对人类驾驶员示范数据的模仿,依托模型输出和驾驶员决策控制量的差值对驾驶模型进行迭代更新。随着车企驾驶数据的累积,监督学习算法成为“端到端”自动驾驶的主流方案,然而其性能上限严重受制于驾驶数据的数量、质量和多样性,目前仅特斯拉公司实现了该方案的车载落地。与监督学习相比,强化学习不依赖于带有驾驶操作标签的驾驶数据,通过车辆与环境的交互优化和探索试错,逐步提升驾驶性能,具备超越人类的驾驶性能上限。其可综合利用实车和仿真数据进行驾驶模型学习,极大降低了对实车样本的依赖,是清华大学和Wayve等自动驾驶研究机构和企业所采用的主要方案。清华大学于2024年成功开发了国内首套依托强化学习的自动驾驶系统,率先完成城市工况的开放道路验证,虽尚未达到量产落地水平,但仍展现了强化学习决控训练方案的优异性能。
3)“端到端”自动驾驶模型设计和训练
“端到端”自动驾驶模型的本质是实现感知到规控的全栈式神经网络化,直接从多模态环境信息输入生成驾驶控制指令,从而使其具备数据闭环快速迭代进化的能力。根据“端到端”自动驾驶模型架构设计的不同,主要分为分模块模型和单模型架构两种形式。分模块“端到端”模型将驾驶系统划分为相对独立的功能模块,如感知、预测、规控等,各模块分别进行优化和训练,各模块之间依靠结构化数据进行信息传输。尽管整体上实现了“端到端”学习,但其内部仍保留了功能模块的逻辑分层,兼顾“端到端”模型的数据闭环能力和模块化设计的可解释性,是当前车企的关注重点。单模型“端到端”架构以整体化设计为核心,直接从多模态输入生成驾驶控制指令,感知、决策和控制通过统一的网络进行联合训练。其内部虽然仍可能有模块区分用于中间监测,但模块与模块之间的信息传递可依赖高维度特征向量,且神经网络具有充分的训练自由度,最大程度地减少了传感器到执行器之间的信息损失,体现了更强的整体性,但也增加了模型训练难度,目前尚处于前瞻研究阶段。
4)模型压缩部署
“端到端”自动驾驶的应用面临车载计算资源不足的挑战。为了应对这一挑战,模型压缩技术成为关键研究方向,主要包括模型剪枝、模型量化和编译优化,旨在较少影响网络性能的前提下降低网络的计算需求,提升车载计算平台的运行速度。模型剪枝技术通过移除模型中不重要的权重或结构来减少模型的复杂度。目前,基于强关联平滑约束的目标检测模型剪枝方法,在剪枝率达到80%时,相比原网络,识别精度的衰减可以控制在3%以内。模型量化则是将模型的权重和激活从32 Bit高位宽浮点数转换为8 Bit甚至更低精度的定点数表示,以此减少对模型参数的大小和计算资源的需求。基于通道均衡的量化算法,在8 Bit量化的情况下,精度损失通常在1个百分点以内,但存储和计算开销可以降低到原来的25%以下。此外,在量化模型的基础上,通过量化训练可以进一步提升量化网络的精度,有时甚至能超过原有浮点网络的精度。编译优化则涉及在模型部署前和运行时对模型的计算图进行优化,参考硬件架构设计编译和运行工具链,以充分发挥硬件性能。这包括算子融合、数据排布优化等技术,可以提高运行时效率,并带来显著的速度提升。尽管模型压缩技术的方法论目前已经相对成熟,并在安防等领域得到广泛应用,但在自动驾驶“端到端”模型和硬件平台方面,仍需要进一步调整和适配以满足特定的需求。
5)融合大模型的“端到端”自动驾驶
近年,以GPT为代表的自然语言处理领域内生成式人工智能大模型冲击着自动驾驶领域,各厂商将具备文字、语音、图像处理能力的多模态大模型(Vision-language Model, VLM)融入自动驾驶系统,出现了融合视觉、语言和动作的多模态大模型范式即视觉-语言-动作模型(Vision-language-action Model, VLA),能够直接从传感器数据中提取丰富的环境信息,并借助语言模型理解人类指令并生成可解释的决策过程,最后将多模态信息转化为具体的驾驶操作指令。
3 智能驾驶技术面临的关键技术挑战
尽管智能驾驶技术在硬件、软件和系统集成等方面取得了显著进展,但其在复杂开放道路环境中的大规模普及应用仍面临诸多挑战。首先,智能驾驶系统的安全性和可靠性是核心问题,尤其是在极端天气、复杂交通交互和长尾场景下的表现仍需进一步提升。其次,智能驾驶技术的硬件成本与性能之间的平衡问题尚未完全解决,尤其是在车载芯片、传感器和执行器等关键部件的能效、精度和可靠性方面仍存在瓶颈。此外,智能驾驶软件系统的实时性、可解释性和泛化能力亟待优化,尤其是在多传感器数据融合、决策规划算法和运动控制策略等方面仍需突破。最后,智能驾驶技术的测试验证体系尚不完善,如何构建覆盖多样化场景的高效仿真测试平台和统一的评价标准,是推动技术落地的重要前提。
3.1 硬件支持系统
1)车载芯片的能效与安全性有待继续提升
车载芯片是智能驾驶系统的算力核心,但仍面临技术瓶颈。存算一体技术尽管提高了芯片能效,但误差控制尚需优化以满足智能驾驶系统的实时性和精度要求。同时,高算力与低功耗之间的平衡仍是研发重点,尤其是确保在能源受限情况下维持芯片的高性能。此外,冗余设计虽能提升系统安全性,但也带来更高的成本和复杂性,如何实现低成本的高可靠性成为设计的重要挑战。
2)传感器的融合精度与经济性挑战巨大
车载传感器性能的提升直接决定智能驾驶的安全性和精准性。然而,多传感器数据融合面临延迟与一致性问题,影响实时决策效率。激光雷达虽然具备高精度感知能力,但成本过高限制了其普及,行业亟需技术创新以降低生产成本。毫米波雷达在复杂环境下的分辨率不足仍是技术短板,如何提升其精准性以满足动态目标识别需求是重要方向。
3)控制器系统高性能与低功耗平衡难度高
作为智能驾驶的大脑,控制器需同时满足计算性能和能源效率的高要求。高精度、低延迟的通信是保障实时决策的关键,但多传感器环境下的通信效率仍待优化。此外,冗余设计虽然能够提升容错能力,但复杂性和成本增加的问题需要有效解决,尤其是在满足严格安全标准的同时降低研发和制造成本。
4)智能执行器需要一体化与可靠性优化
执行器是将驾驶指令转化为实际动作的关键部件,其智能化和协同能力直接影响系统的安全性和稳定性。电控转向系统需通过优化冗余设计以在安全性与成本之间找到平衡。电控制动的快速响应和高精度控制能力仍是复杂驾驶场景下的技术瓶颈,而线控底盘的一体化设计需要进一步完善多执行器之间的协同机制,以确保在各种驾驶工况下的稳定性和舒适性。
3.2 软件功能系统
1)开放道路长尾场景对于智能驾驶系统安全性带来新的挑战
智能驾驶技术的部署逐渐从封闭场景走向开放道路,其中开放道路存在大量复杂的长尾场景,场景虽少见但极具挑战性,其不可预测性使得现有算法难以全面覆盖,系统可能在关键时刻出现误判或反应滞后,引发智能驾驶系统的安全性和稳定性挑战。如何构建覆盖多样化场景的高质量数据集提升系统的泛化能力,开展大规模数据集中长尾场景的挖掘与重建,设计具备长尾场景应对能力的智能驾驶大模型,保障智能驾驶系统在长尾场景中的安全应对能力,是智能驾驶技术进一步推广应用的关键挑战
2)复杂大规模智能驾驶模型对于车端推理算力存在巨大需求
随着智能驾驶模型逐步向“端到端”、大模型驱动的方向发展,模型规模不断扩大,需要大量实时计算支持以保证智能驾驶系统对环境的快速响应,对车端推理算力的需求以指数级增长。当前,车载芯片硬件的性能和能效比难以满足这种需求,对大模型在智能驾驶系统上部署的实时性带来挑战。如何通过边缘计算与云端协同架构优化算力分配,开展智能驾驶模型的轻量化设计,研发新型硬件架构,推动异构计算和高效加速器芯片的应用,有效满足大规模“端到端”智能驾驶模型的车端推理算力需求,是当前智能驾驶系统实现高效和可靠运行的核心瓶颈。
3)简单场景仿真测试难以满足当前真实世界场景大规模测试需求
智能驾驶技术的开发与验证高度依赖仿真测试,但当前的测试工具大多功能单一,覆盖范围有限,难以满足真实场景对系统验证的需求。尽管已有一些仿真平台引入了多种交通环境变量和动态工况,但由于缺乏标准化场景和数据共享机制,仿真测试的效率和可信度仍然不足。此外,测试中往往难以模拟极端工况,如恶劣天气条件、交通事故等实际场景。如何构建符合真实场景的大规模仿真测试平台成为智能驾驶商业化应用的关键瓶颈之一。建立标准化驾驶仿真场景库,通过行业协作建立覆盖多样化交通环境的仿真场景库;实现真实场景与虚拟场景的联动验证,利用实际道路测试结果反哺仿真模型以提升其真实性;仿真平台性能的扩展与优化,借助云计算和分布式系统支持大规模并行测试,提高测试效率与广度。
4)智能驾驶开发过程涉及的时空数据地理信息安全需要进一步保障
随着高精度地图和实时驾驶数据在智能驾驶技术中的应用愈加广泛,时空数据和地理信息的安全问题日益凸显。智能驾驶系统所采集的数据通常涉及动态更新的交通数据、天气信息及车路协同通信等关键内容,一旦被篡改或泄露,不仅可能引发隐私泄露和网络攻击,甚至带来国家测绘数据安全等更广泛的安全隐患。如何确保时空数据在采集、存储和传输过程中的安全性,建立健全的数据加密和验证机制,是当前亟待解决的重要挑战。
3.3 “端到端”自动驾驶系统
尽管“端到端”方法在理论和实践上都展现出巨大的潜力,但在驾驶安全方面仍然面临着诸多挑战,主要体现在数据、算法、模型,以及压缩和量化4个方面。
1)数据质量和多样性不足
“端到端”自动驾驶系统性能高度依赖训练数据的质量和多样性。现实世界的驾驶环境复杂多变,包括不同的天气条件、光照变化、道路类型及交通状况等,且存在长尾分布特性。通过采集得到的驾驶示范数据难以涵盖所有驾驶可能,多样性的不足导致模型缺乏对未见和险态场景的学习和理解,从而增加驾驶风险。此外,高质量的标注数据对于训练可靠的模型至关重要。然而,由于人力标注的复杂性和主观性,数据标注过程中可能存在错误或不一致。例如,不同的标注人员可能对同一场景作出不同的解释,或者在复杂的场景中遗漏关键的细节,将会导致模型学习到错误的信息,进而影响其在实际应用中的性能。
2)算法缺乏安全性和鲁棒性保障
现有“端到端”驾驶模型训练算法未考虑多元驾驶安全约束,由于交通参与者的动态性、随机性和复杂性,所学驾驶模型难以满足实车安全性要求。此外,驾驶网络更新自动驾驶系统需要在各种复杂、多变的环境中运行,传感器数据可能受到噪声、干扰或异常情况的影响。例如,在强光照、雨雪天气或隧道中,摄像头捕获的图像质量可能下降。如果模型无法适应这些变化,可能无法正确识别相关信息进而做出错误的驾驶决策。现有训练算法缺乏控制鲁棒性和稳定性理论基础,易受不确定性影响导致错误决策。自动驾驶模型需依赖数据闭环持续迭代,现有训练算法难以保证模型性能的稳定提升,版本换代极易导致新型安全事故。
3)模型泛化能力和可解释性问题
首先,由于训练数据的有限性和偏差,“端到端”自动驾驶模型极有可能过拟合训练数据,难以适用于长尾和险态驾驶场景。其次,“端到端”自动驾驶系统通常依赖深度神经网络,这些模型被视为“黑盒”,难以理解其内部决策过程。这种缺乏可解释性的问题在安全关键的应用中尤为突出。当系统发生错误或事故时,无法追溯模型的决策依据,给故障分析和改进带来困难。最后,网络模型参数的日益膨胀严重制约决策实时性,可能导致系统反应迟缓,进而引发安全事故。
4)安全性与性能的权衡难题
模型量化压缩过程可导致模型精度下降,与原始模型在数值和行为上可能存在差异。这使得原本适用于全精度模型的验证和测试结果不能直接应用,需要对压缩后的模型重新进行全面的验证和测试。然而,智能驾驶系统的运行环境极其复杂,潜在驾驶场景数量庞大,全面验证驾驶模型的安全性是一项巨大的挑战。
5)大模型的车端部署挑战
车辆运行具有极高的准确性、实时性要求。VLA等大模型的车端部署应用面临着车端算力不足的问题。具备智能涌现的大语言模型参数至少在10亿级别,并且随着VLA的模型结构更复杂,参数也会进一步扩大,对硬件算力和数据闭环的迭代能力要求就更高。车端算力的局限性使得VLA大模型难以满足高实时控制要求。
4 发展方向及对策建议
4.1 发展方向
1)硬件支持系统正在向融合一体化方向发展
未来车载芯片将发展存算一体与可重构计算架构,重点提升算力与能效,支持高阶自动驾驶。尤其是在国产自主化方面,国内企业将加大芯片研发力度,推动自主可控的车载芯片平台的突破。通过优化AI加速器和算力架构,国产车载芯片将在高算力和低功耗方面逐步与国际领先水平接轨,满足高阶自动驾驶对实时计算和低功耗的需求。激光雷达、毫米波雷达和摄像头将向智能化与融合方向发展,借助AI算法增强复杂环境中的目标识别和感知能力。传感器数据融合技术将进一步提高系统对多变环境的适应能力,提升实时感知精度。控制与执行器系统将深入探索模块化与线控一体化技术,提升灵活性与系统扩展性。强化冗余设计确保系统在复杂场景中的安全性与稳定性,提升容错能力,确保智能驾驶系统的可靠运行。
2)软件系统技术正在向高稳定和高安全方向发展
高精地图从传统地理信息拓展为融合实时交通、环境变化、天气条件和车路协同信息的综合载体,同时定位技术通过GNSS、惯性测量单元(Inertial Measurement Unit, IMU)、视觉和激光雷达等多源协同提升精度与稳定性。数据驱动成为智能驾驶优化的核心,通过大规模多模态数据采集与大模型训练,系统在动态场景中的感知、决策能力显著增强,实现从场景特化到通用性算法的升级。仿真测试从单一验证工具演化为涵盖多场景和复杂变量的综合平台。未来, 依托云计算实现大规模并行验证,可显著缩短研发周期并提升效率。软硬件一体化设计趋势显现,算法与硬件架构协同优化推动模块在高性能平台上的高效运行,同时域控制器等硬件设计增强了系统实时性和复杂场景处理能力,为智能驾驶的安全性和智能化水平提供坚实支撑。
3)“端到端”自动驾驶正在向路云数据赋能方向发展
推动车路云一体化基础设施建设,提升训练数据的完备性,可以有效提升“端到端”自动驾驶系统的安全性和可靠性。建立车与路侧基础设施的高速通信能力,使得车辆获取更全面精确环境感知数据和超视距感知结果,为车辆提供实时交通信息、地图更新、远程诊断等服务,辅助车辆做出更智能的决策。推动云端基础平台建设,开发数据众包采集、云端自标注和虚拟数据增强、知识数据混合驱动模型训练等全栈式工具链,提高驾驶模型迭代效率,实现高效的模型更新与部署,全面提升智能驾驶系统在复杂环境下的安全决策能力。
4.2 对策建议
1)加强硬件技术自主可控,推动国产化进程
智能驾驶硬件支持系统需要优先推动芯片、传感器和控制器的国产化。建议强化供应链安全体系,提升国产硬件的技术成熟度,逐步摆脱对国际供应商的依赖。支持国产技术研发,通过资金投入、税收减免和研发补贴,鼓励国内企业进行关键技术攻关。进一步强化硬件和算法的协同优化,构建自主可控、高效稳定的车载智能系统,提升中国智能驾驶产业链的全球竞争力。
2)打造国产智能驾驶软件技术生态
发展智能驾驶软件系统的核心是推动底层技术的自主化。建议设立专项基金,支持国产操作系统及中间件的开发,并集中攻克实时性、安全性和扩展性等技术难点。通过政策引导和试点项目推动企业采用国产解决方案,同时加强法律法规建设,加速数据格式、算法接口和功能安全等领域的标准化,保障软件合规性和技术应用落地。建立智能驾驶领域的开源社区,整合企业、高校和科研机构资源,打造涵盖操作系统、中间件和算法模型的开源生态,为智能驾驶行业构建开放、协同、可持续的创新环境。
3)建立统一的智能驾驶测试评价体系
智能驾驶技术的验证需要高效的仿真测试和统一的评价标准。建议建设国家级自动驾驶仿真测试中心,整合复杂交通场景,构建开放共享的场景库,为行业提供高效的仿真测试环境和统一的测试评价标准。通过云平台支持大规模数据存储与计算,满足复杂场景下的验证需求。同步推进测试数据共享和认证机制建设,将仿真测试与道路实测相结合,提升验证效率与结果权威性,为智能驾驶技术的安全落地提供可靠支撑。
4)推动“端到端”自动驾驶技术创新,加速场景落地
“端到端”智能驾驶技术需要通过数据、模型和部署的全链条优化实现突破。建议依托车路云一体化系统建立跨区域、跨企业的数据共享平台,结合自动化标注工具提升数据质量;通过强化学习减少对标注数据的依赖,同时结合仿真测试和实际道路验证,确保模型的鲁棒性。模型压缩技术的应用能够满足边缘设备的实时计算需求,同时通过V2X技术增强模型的环境适应能力,加速“端到端”智能驾驶在实际场景中的部署与商业化落地应用。
5 结束语
智能驾驶技术作为未来交通系统的核心驱动力,正在深刻改变汽车产业的面貌,并推动社会向更安全、更高效、更环保的方向发展。文章系统梳理了智能驾驶技术的发展历程,从硬件支持系统、软件功能系统到“端到端”自动驾驶系统,全面总结了当前的技术现状与面临的挑战。尽管智能驾驶技术在硬件能效、软件稳定性、系统泛化能力等方面仍存在诸多瓶颈,但随着人工智能、传感器技术、车路云协同等领域的不断突破,智能驾驶技术正朝着硬件融合一体化、软件高稳定性与安全性、“端到端”车路云协同赋能的方向加速演进。未来,智能驾驶技术的发展将依赖硬件自主可控、国产软件生态的构建、统一测试评价体系的建立、“端到端”技术的创新与落地。通过产学研协同创新,推动智能驾驶技术的规模化应用,将为中国汽车产业的智能化转型提供强有力的支撑,助力实现交通强国战略目标。
END
关于本刊
《前瞻科技》是由中国科学技术协会主管,科技导报社主办、出版的科技智库型自然科学综合类学术期刊,于2022年创刊。
办刊宗旨:围绕国家重大战略任务、科技前沿重要领域和关键核心技术,刊载相关研究成果的综述和述评,促进学术交流,推动科技进步,服务我国经济社会高质量发展。
常设栏目有“前瞻”“综述与述评”“聚焦”“论坛”“文化”“书评”等,其中“前瞻”“综述与述评”为固定栏目,其他为非固定栏目。
期刊官网:www.qianzhankeji.cn
以上就是小编为大家整理的综述与述评 | 李升波,江昆,等:汽车智能驾驶技术发展与趋势展望,想要了解更多优质的相关资讯,请大家多多关注"大世界日记"。