Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Apprendre à conduire de manière éthique : intégrer le raisonnement moral à la conduite autonome

Created by
  • Haebom

Auteur

Dianzhao Li, Ostap Okhrin

Contour

Cet article présente un cadre hiérarchique d'apprentissage par renforcement sécurisé (Safe RL) pour la prise de décision éthique dans les véhicules autonomes. Ce cadre s'articule autour d'un agent Safe RL qui génère des objectifs d'action de haut niveau en utilisant les coûts du risque éthique, combinant la probabilité d'accident et la gravité des dommages. Il s'appuie sur un mécanisme dynamique de relecture d'expériences priorisées pour améliorer l'apprentissage des événements rares mais critiques à haut risque, et génère des trajectoires fluides et réalisables grâce à la planification polynomiale des trajectoires et aux contrôleurs PID et Stanley. L'apprentissage et la validation à l'aide de données de trafic réelles démontrent des performances supérieures aux méthodes existantes en termes de réduction du risque éthique et de maintien des performances de conduite. Il s'agit notamment de la première étude Safe RL évaluant la prise de décision éthique dans les véhicules autonomes dans un scénario réel de trafic mixte.

Takeaways, Limitations

Takeaways:
Présentation et validation des performances d'un cadre Safe RL pour la prise de décision éthique dans les véhicules autonomes utilisant des données du monde réel.
Développer un système de prise de décision qui prend explicitement en compte les risques éthiques (probabilité de collision et gravité des dommages).
Apprentissage amélioré des événements à haut risque grâce à des mécanismes de relecture d'expériences prioritaires dynamiques.
Améliorer l’autonomie éthiquement responsable en combinant la théorie du contrôle formel et l’apprentissage basé sur les données.
Contribuer à la protection des usagers vulnérables de la route tels que les piétons et les cyclistes.
Limitations:
Des recherches supplémentaires sont nécessaires sur les limites et la généralisabilité des ensembles de données du monde réel.
Un examen plus approfondi est nécessaire pour déterminer si un traitement complet de divers dilemmes éthiques est justifié.
Une analyse plus approfondie du coût de calcul et des performances en temps réel du cadre est nécessaire.
Une validation supplémentaire de la sécurité et de la fiabilité à long terme est nécessaire.
👍