यह शोधपत्र बहुविधीय वृहत्-स्तरीय भाषा मॉडल (एमएलएलएम) में हालिया प्रगति पर चर्चा करता है, जो सन्निहित एजेंटों में कोड नीति निर्माण के लिए समृद्ध अवधारणात्मक साक्ष्य को सक्षम बनाता है। अधिकांश मौजूदा प्रणालियों में नीति निष्पादन की अनुकूली निगरानी और कार्य पूरा होने के दौरान कोड पुनर्प्राप्ति के लिए प्रभावी तंत्रों का अभाव है। यह अध्ययन HyCodePolicy का परिचय देता है, जो एक संकर भाषा-आधारित नियंत्रण ढाँचा है जो सन्निहित एजेंटों के बंद-लूप प्रोग्रामिंग चक्र में कोड संश्लेषण, ज्यामितीय साक्ष्य, अवधारणात्मक निगरानी और पुनरावृत्त पुनर्प्राप्ति को व्यवस्थित रूप से एकीकृत करता है। एक प्राकृतिक भाषा निर्देश दिए जाने पर, सिस्टम पहले उसे उप-लक्ष्यों में विघटित करता है और वस्तु-उन्मुख ज्यामितीय आदिमों पर आधारित एक प्रारंभिक निष्पादन योग्य प्रोग्राम उत्पन्न करता है। फिर, जब प्रोग्राम सिमुलेशन में निष्पादित होता है, तो एक विज़न-लैंग्वेज मॉडल (वीएलएम) निष्पादन विफलताओं का पता लगाने, स्थानीयकृत करने और उनके कारण का अनुमान लगाने के लिए चयनित चेकपॉइंट्स का अवलोकन करता है। वीएलएम-आधारित अवधारणात्मक प्रतिक्रिया के साथ प्रोग्राम-स्तरीय घटनाओं को पकड़ने वाले संरचित निष्पादन ट्रेस को एकीकृत करके, HyCodePolicy विफलताओं का कारण अनुमान लगाता है और प्रोग्राम को पुनर्प्राप्त करता है। यह हाइब्रिड डुअल-फीडबैक तंत्र न्यूनतम मानवीय पर्यवेक्षण के साथ स्व-सुधारात्मक प्रोग्राम संश्लेषण को सक्षम बनाता है। प्रायोगिक परिणाम दर्शाते हैं कि HyCodePolicy रोबोट हेरफेर नीतियों की मज़बूती और नमूना दक्षता में उल्लेखनीय सुधार करता है, जिससे स्वायत्त निर्णय-निर्माण पाइपलाइनों में बहु-मॉडल अनुमान को एकीकृत करने के लिए एक मापनीय रणनीति उपलब्ध होती है।