Para abordar el problema de la generación de movimiento en tiempo real, esencial para lograr un movimiento responsivo y adaptativo bajo restricciones de movimiento en sistemas de alta dimensión, presentamos un enfoque de dos pasos. Primero, aprendemos fuera de línea una variedad de trayectorias de baja dimensión que satisface las restricciones relacionadas con la tarea, y luego realizamos una búsqueda rápida en línea dentro de esta variedad. Extendiendo el marco existente de primitivas de variedad de movimiento (MMP) en tiempo discreto, proponemos una nueva arquitectura de red neuronal, la primitiva de variedad de movimiento diferenciable (DMMP), que se entrena con datos de optimización de trayectorias recopilados fuera de línea con una estrategia que garantiza el cumplimiento de las restricciones. Mediante experimentos de lanzamiento dinámico con un brazo robótico de 7 grados de libertad, demostramos que DMMP supera a los métodos existentes en términos de velocidad de planificación, tasa de éxito de la tarea y cumplimiento de las restricciones.