Dans cet article, nous abordons le problème suivant : la simple intégration de tous les états proprioceptifs d’une entrée multimodale (par exemple, images RVB, langage et états proprioceptifs) dans un modèle d’apprentissage par imitation pour des tâches robotiques entraîne de faibles performances d’apprentissage par imitation. Nous définissons ce phénomène comme le « problème de variation proprioceptive » et montrons que le problème réside dans la différence de distribution des états proprioceptifs entre l’apprentissage et le déploiement. Pour y remédier, nous proposons un cadre d’adaptation de domaine qui réduit l’écart entre l’apprentissage et le déploiement en utilisant les données de déploiement collectées pendant le déploiement. Nous quantifions l’inadéquation entre les états proprioceptifs experts et déployés à l’aide de la distance de Wasserstein, et minimisons cet écart en ajoutant un bruit proportionnel à la distance de Wasserstein aux deux ensembles d’états. Les résultats expérimentaux montrent que la méthode proposée améliore les performances des politiques d’imitation en utilisant les informations proprioceptives tout en atténuant leurs effets négatifs.