यह शोधपत्र दीर्घकालिक वस्तु हेरफेर के लिए एक नवीन रोबोटिक नियंत्रण ढाँचा प्रस्तुत करता है। चूँकि मौजूदा शिक्षण-आधारित दृष्टिकोण बड़े, कार्य-विशिष्ट डेटासेट पर निर्भर करते हैं और अज्ञात परिदृश्यों के लिए सामान्यीकरण करने में कठिनाई का अनुभव करते हैं, यह अध्ययन एक बंद-लूप ढाँचे का प्रस्ताव करता है जो पूर्व-प्रशिक्षित निम्न-स्तरीय नियंत्रकों पर निर्भर रहने के बजाय, सीधे निष्पादन योग्य कोड योजनाएँ उत्पन्न करने के लिए एक बड़े पैमाने के भाषा मॉडल (LLM) का उपयोग करता है। LLM, विचार-प्रक्रिया (CoT) और उत्तरोत्तर संरचित उदाहरणों द्वारा निर्देशित शिक्षण के कुछ पुनरावृत्तियों के माध्यम से सुदृढ़ और सामान्यीकृत कार्य योजनाएँ उत्पन्न करता है। RGB-D का उपयोग करने वाला एक रिपोर्टर परिणामों का मूल्यांकन करता है और संरचित प्रतिक्रिया प्रदान करता है, जिससे आंशिक अवलोकन के तहत त्रुटि सुधार और पुनर्योजना संभव हो पाती है। यह चरण-दर-चरण अनुमान को समाप्त करता है, गणना संबंधी ओवरहेड को कम करता है, और पिछली विधियों में देखी गई त्रुटि संचयन को सीमित करता है। यह अव्यवस्थित वास्तविक दुनिया के वातावरणों में, जिनमें लोहोरावेन्स, कैल्विन, फ्रैंका किचन और अन्य शामिल हैं, 30 से अधिक विविध दीर्घ-अवधि के कार्यों, ज्ञात और अज्ञात दोनों, पर अत्याधुनिक प्रदर्शन प्राप्त करता है।