本文介绍了一种新型自动驾驶规划器 TreeIRL。TreeIRL 结合了蒙特卡洛树搜索 (MCTS) 和逆向强化学习 (IRL),在模拟和实际驾驶中均实现了最佳性能。其核心思想是利用 MCTS 寻找一组安全的候选轨迹,并使用深度 IRL 评分函数从中选择最接近人类驾驶的轨迹。在拉斯维加斯市区超过 500 英里的实际自动驾驶环境中,TreeIRL 已与经典和最先进的规划器进行了对比评估。测试场景包括拥堵的城市交通、自适应巡航控制、超车和交通信号灯。TreeIRL 通过平衡安全性、进度、舒适性和人性化程度,实现了最佳的整体性能。