每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

TreeIRL:通过树搜索和逆向强化学习实现安全的城市驾驶

Created by
  • Haebom

作者

Momchil S. Tomov、Sang Uk Lee、Hansford Hendrago、Jinwook Huh、Teawon Han、Forbes Howington、Rafael da Silva、Gianmarco Bernasconi、Marc Heim、Samuel Findler、Xiaonan Ji、Alexander Boule、Michael Napoli、Kuo Chen、Jesse Miller、Boaz Floor、Yunqing Hu

大纲

TreeIRL 是一款新颖的自动驾驶规划器,它结合了蒙特卡洛树搜索 (MCTS) 和逆向强化学习 (IRL),在模拟和实际驾驶中均实现了最佳性能。MCTS 用于识别一组安全的候选轨迹,并使用深度 IRL 评分函数从中选出最接近人类驾驶的轨迹。TreeIRL 已在拉斯维加斯都会区大规模模拟和超过 500 英里的实际自动驾驶环境中进行了测试。测试场景包括拥堵的城市交通、自适应巡航控制、超车和交通信号灯。TreeIRL 通过平衡安全性、进度、舒适性和人性化程度,实现了最佳的整体性能。

Takeaways, Limitations

基于MCTS的方案首次在公共道路上进行了演示。
它强调了根据各种指标和现实环境评估规划者的重要性。
通过强化学习和模仿学习可以实现进一步的改进,并且它提供了一个框架来探索经典方法和基于学习的方法的各种组合,以解决自动驾驶中的规划瓶颈。
👍