本报讯(记者陈彬)清华大学自动化系智能交通研究团队助理教授封硕与美国密歇根大学科研人员合作,研发出一套全新的安全测试系统,为“人工智能(AI)司机”量身定制出一套“驾考试题”。日前,该成果发表于《自然》并登上当期封面。
目前,无人驾驶汽车的安全性能测试亟须解决“百亿公里”难题,即在自动驾驶汽车投入大规模应用前,需要开展大规模的道路测试,从统计学上验证自动驾驶汽车的安全性。据估算,这个测试规模至少要达到百亿公里。从时间、资源与成本上看,在实际道路上进行测试显然难以实现。
如何以最小成本、最高效地找出自动驾驶汽车的安全问题?封硕带领团队从统计学的视角寻找研究切入点。“这本质上是一个超高维空间小概率事件的期望估计问题。”封硕说。从统计学的视角将实际问题转化为学术问题后,他们从理论层面创造性地提出了密集强化学习方法(D2RL),通过识别和删除非安全关键状态、连接安全关键状态,并在编辑后的马尔科夫过程中训练神经网络,解决了“稀疏度灾难”。同时,他们利用D2RL训练交通环境中的背景车辆,构建出一个由自动驾驶汽车和背景车辆组成的智能测试环境,从而实现模拟环境替代实际道路环境。
“通俗地说,我们的智能测试系统将自动驾驶汽车周围的背景车辆模拟成智能体,大家有着不同的驾驶目的。自动驾驶汽车希望更安全地行驶,背景车辆希望更好地帮助自动驾驶汽车发现安全问题。这样我们就可以通过改变背景车辆的行为实现对自动驾驶汽车安全性能的测试,让测试里程大幅减少,让测试过程变得更高效。”封硕将这一过程比喻为“AI司机”寻找“陪练”9博体育。
为了让“陪练”更精准、有效地提供帮助,研究团队收集了海量的人类驾驶数据对“陪练”进行拟人化训练,并通过技术手段增加“陪练”的“危险系数”,从而增强测试环境的挑战性。
基于增强现实测试平台,研究团队对L4级自动驾驶汽车开展了安全性测试。结果表明,这种方法不仅可以有效学习生成智能测试环境,而且与在自然驾驶环境中测试自动驾驶汽车相比,智能测试环境可以使评估加快多个数量级(约103至105)。这意味着实验中每1公里的测试,近似等价于实际道路测试中1000到1万公里的测试,极大加速了安全测试流程。