Cet article présente une méthode visant à améliorer la robustesse de la technique de clonage de comportement (BC). Bien que le BC soit une technique d'apprentissage par imitation efficace qui entraîne des politiques en utilisant uniquement des données expertes de paires état-action, il est sujet à des erreurs de mesure et à des interférences adverses lors du déploiement. Ces erreurs peuvent conduire les agents à des actions sous-optimales. Cette étude démontre que l'utilisation de la régularisation Lipschitz globale améliore la robustesse du réseau de politiques appris, garantissant ainsi sa robustesse face à diverses perturbations de normes bornées. De plus, nous proposons une méthode de construction d'un réseau de neurones Lipschitz garantissant la robustesse des politiques, et validons expérimentalement cette méthode dans différents environnements Gymnasium.