[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

ÉValuation des algorithmes d'apprentissage par renforcement pour la navigation chez des quadrupèdes robotisés simulés : une étude comparative inspirée du comportement des chiens guides

Created by
  • Haebom

Auteur

Emma MA Harrison

Contour

Cette étude vise à améliorer les capacités de navigation autonome et d'évitement d'obstacles d'un robot quadrupède simulé grâce à des algorithmes d'apprentissage par renforcement. Nous nous concentrons plus particulièrement sur le développement d'une simulation de chien-guide robotisé pour personnes malvoyantes et espérons contribuer à l'expansion de la recherche sur les animaux robotisés médicaux (tels que les chiens-guides et les chiens d'alerte). Trois algorithmes, Proximal Policy Optimization (PPO), Deep Q-Network (DQN) et Q-learning, ont été comparés, analysés et évalués en fonction de la détection de collision, de l'algorithme de recherche de chemin, de l'utilisation de capteurs, du type de robot et de la plateforme de simulation. Les résultats expérimentaux dans un environnement créé par nos soins ont montré que l'algorithme PPO surpassait les deux autres algorithmes en termes de nombre moyen et médian d'étapes nécessaires pour atteindre le point cible.

Takeaways, Limitations

Takeaways:
Nous démontrons que l’algorithme PPO est efficace pour la navigation autonome et l’évitement d’obstacles des robots marcheurs quadrupèdes.
Présentation de la possibilité de développer un chien-guide robot pour les malvoyants.
Offrir de nouvelles possibilités pour la recherche sur les animaux robotisés médicaux.
Contribuer au développement d'une technologie de navigation robotique basée sur l'apprentissage par renforcement.
Limitations:
Ces résultats proviennent d’un environnement de simulation et des recherches supplémentaires sont nécessaires pour une application à des environnements réels.
Une validation supplémentaire de la capacité de généralisation du robot à une variété d’environnements et d’obstacles est nécessaire.
Des recherches supplémentaires sont nécessaires pour mettre en œuvre des fonctions complexes de chiens guides réels (reconnaissance des sons, reconnaissance des émotions du propriétaire, etc.).
👍