Dans cet article, nous présentons une nouvelle méthodologie, le contrôle d'actions latentes basé sur les compétences (SLAC), visant à relever les défis d'évolutivité de l'apprentissage par renforcement (RL) pour la construction de robots domestiques et industriels nécessitant un contrôle système à haut degré de liberté (DoF). Pour répondre aux défis d'exploration sûre et d'efficacité d'échantillonnage élevés de l'apprentissage par renforcement traditionnel en situation réelle, ainsi qu'à l'écart entre la simulation et le monde réel, SLAC pré-entraîne un espace d'actions latentes indépendant de la tâche à l'aide d'un simulateur basse fidélité. Cet espace d'actions latentes est appris via une méthode de découverte de compétences non supervisée conçue pour favoriser l'abstraction temporelle, la séparation et la sécurité, puis est utilisé comme interface d'action pour un nouvel algorithme d'apprentissage par renforcement hors stratégie afin d'apprendre de manière autonome des tâches en aval via des interactions en situation réelle. Les résultats expérimentaux montrent que SLAC atteint des performances de pointe sur diverses tâches de manipulation bilatérale et apprend des tâches corporelles complètes à contact élevé en moins d'une heure, sans aucune démonstration ni connaissance préalable d'action manuelle.