Dans cet article, nous proposons KD-BIRL, une nouvelle méthode bayésienne IRL qui améliore les performances de l'apprentissage par renforcement inverse (IRL) à partir de données de démonstration expertes limitées. Alors que les méthodes bayésiennes IRL existantes nécessitent de grands ensembles de données, KD-BIRL infère des fonctions de récompense plus précises, même dans des situations de données limitées, en exploitant les données existantes spécifiques au domaine (démonstrations expertes de la tâche d'apprentissage et fonctions de récompense connues). Ceci est réalisé en améliorant l'estimation de vraisemblance sur différentes fonctions de récompense et échantillons de démonstration à l'aide d'un estimateur de densité à noyau conditionnel. Les résultats expérimentaux démontrent que KD-BIRL atteint une convergence plus rapide que les méthodes existantes et est particulièrement efficace dans un environnement de données de démonstration expertes de tâches de test limitées. De plus, cet article fournit la première garantie théorique pour un algorithme bayésien IRL.