Cet article présente un nouveau cadre combinant des approches basées sur des modèles et des approches basées sur l'apprentissage pour résoudre le problème de la manipulation non préhensile. En combinant l'efficacité des approches basées sur des modèles et la robustesse des approches basées sur l'apprentissage, nous obtenons un apprentissage efficace par échantillon en concevant un apprentissage par renforcement profond (RL) guidé par démonstration, basé sur une optimisation implicite de trajectoire de contact (CITO) à haute efficacité computationnelle, qui prend explicitement en compte les points de contact. De plus, nous présentons une approche de transfert de la simulation vers le réel utilisant une stratégie d'apprentissage privilégiée pour permettre à un robot d'effectuer une manipulation de pivot en utilisant uniquement la proprioception, la vision et la détection de force, sans informations privilégiées (par exemple, la masse, la taille ou la pose de l'objet). L'évaluation de plusieurs tâches de pivot démontre la mise en œuvre réussie du transfert de la simulation vers le réel. Pour plus de détails, consultez la vidéo disponible sur YouTube.