Este artículo presenta un novedoso marco de control robótico para la manipulación de objetos de larga duración. Dado que los enfoques actuales basados en el aprendizaje se basan en grandes conjuntos de datos específicos de cada tarea y presentan dificultades para generalizarse a escenarios desconocidos, este estudio propone un marco de bucle cerrado que utiliza un modelo de lenguaje a gran escala (LLM) para generar planes de código directamente ejecutables, en lugar de depender de controladores de bajo nivel preentrenados. El LLM genera planes de tareas robustos y generalizables mediante unas pocas iteraciones de aprendizaje guiadas por el Curso de Pensamiento (CdP) y ejemplos progresivamente estructurados. Un reportero que utiliza RGB-D evalúa los resultados y proporciona retroalimentación estructurada, lo que permite la corrección de errores y la replanificación bajo observación parcial. Esto elimina la inferencia paso a paso, reduce la sobrecarga computacional y limita la acumulación de errores observada en métodos previos. Logra un rendimiento de vanguardia en más de 30 tareas diversas de larga duración, tanto conocidas como desconocidas, en entornos reales saturados, como LoHoRavens, CALVIN, Franka Kitchen y otros.