每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

TreeIRL:通过树搜索和逆向强化学习实现安全的城市驾驶

Created by
  • Haebom

作者

Momchil S. Tomov、Sang Uk Lee、Hansford Hendrago、Jinwook Huh、Teawon Han、Forbes Howington、Rafael da Silva、Gianmarco Bernasconi、Marc Heim、Samuel Findler、Xiaonan Ji、Alexander Boule、Michael Napoli、Kuo Chen、Jesse Miller、Boaz Floor、Yunqing Hu

TreeIRL:结合 MCTS 和 IRL 实现自动驾驶

大纲

本文介绍了一种新型自动驾驶规划器 TreeIRL。TreeIRL 结合了蒙特卡洛树搜索 (MCTS) 和逆向强化学习 (IRL),在模拟和实际驾驶中均实现了最佳性能。其核心思想是利用 MCTS 寻找一组安全的候选轨迹,并使用深度 IRL 评分函数从中选择最接近人类驾驶的轨迹。在拉斯维加斯市区超过 500 英里的实际自动驾驶环境中,TreeIRL 已与经典和最先进的规划器进行了对比评估。测试场景包括拥堵的城市交通、自适应巡航控制、超车和交通信号灯。TreeIRL 通过平衡安全性、进度、舒适性和人性化程度,实现了最佳的整体性能。

Takeaways, Limitations

首次在公共道路上演示基于 MCTS 的规划。
强调规划器在各种指标和现实环境中评估的重要性。
在安全性、进步性、舒适性和人性化之间取得平衡
我们提出了通过强化学习和模仿学习来扩展和改进 TreeIRL 的可能性。
提供了一个框架,用于探索各种经典方法和基于学习的方法的组合,以解决自动驾驶中的规划瓶颈。
👍