Este artículo destaca que, si bien el aprendizaje por imitación permite un comportamiento robótico experto, presenta dificultades debido a la baja eficiencia de la muestra y una generalización limitada, lo que dificulta la realización de tareas a largo plazo con múltiples objetos. Los métodos existentes requieren numerosas demostraciones para abordar posibles variaciones de la tarea, lo que los hace costosos e imprácticos para aplicaciones reales. Este estudio introduce marcos de affordance orientados, una representación estructurada de espacios de estados y acciones, para mejorar la generalización espacial y de categorías, y entrenar políticas eficientemente con tan solo 10 demostraciones. Más importante aún, esta abstracción permite la generalización compositiva de subpolíticas entrenadas de forma independiente para abordar tareas a largo plazo con múltiples objetos. Para facilitar transiciones fluidas entre subpolíticas, introducimos el concepto de predicción de autoprogreso, derivado directamente de la duración de las demostraciones de entrenamiento. Experimentos en tres tareas reales que involucran interacciones multiobjeto de varios pasos demuestran que las políticas se generalizan robustamente a apariencias de objetos invisibles, formas geométricas y disposiciones espaciales, a pesar de la pequeña cantidad de datos, y alcanzan altas tasas de éxito sin depender de datos de entrenamiento extensos.