Este artículo presenta un nuevo marco que combina enfoques basados en modelos y aprendizaje para resolver el problema de la manipulación no prensil. Combinando la eficiencia de los enfoques basados en modelos con la robustez de los enfoques basados en aprendizaje, logramos un aprendizaje eficiente en muestras mediante el diseño de un aprendizaje de refuerzo profundo (RL) guiado por demostración, basado en la optimización de trayectoria implícita de contacto (CITO) computacionalmente eficiente, que considera explícitamente los puntos de contacto. Además, presentamos un enfoque de transferencia de simulación a realidad mediante una estrategia de entrenamiento privilegiada que permite a un robot realizar la manipulación de pivote utilizando únicamente propiocepción, visión y detección de fuerza, sin información privilegiada (p. ej., masa, tamaño o postura del objeto). La evaluación en múltiples tareas de pivote demuestra la implementación exitosa de la transferencia de simulación a realidad. Puede encontrar más detalles en el video disponible en el enlace de YouTube.