यह शोधपत्र व्यवहार क्लोनिंग (बीसी) तकनीक की सुदृढ़ता में सुधार हेतु एक विधि प्रस्तुत करता है। यद्यपि बीसी एक प्रभावी अनुकरण अधिगम तकनीक है जो केवल विशेषज्ञ अवस्था-क्रिया युग्म डेटा का उपयोग करके नीतियों का प्रशिक्षण देती है, यह परिनियोजन के दौरान मापन त्रुटियों और प्रतिकूल हस्तक्षेप के प्रति संवेदनशील होती है। ये त्रुटियाँ एजेंटों को उप-इष्टतम क्रियाओं की ओर ले जा सकती हैं। यह अध्ययन दर्शाता है कि वैश्विक लिप्सचिट्ज़ नियमन का उपयोग सीखे गए नीति नेटवर्क की सुदृढ़ता में सुधार करता है, जिससे विभिन्न परिबद्ध मानक विक्षोभों के विरुद्ध नीति सुदृढ़ता सुनिश्चित होती है। इसके अलावा, हम एक लिप्सचिट्ज़ तंत्रिका नेटवर्क के निर्माण हेतु एक विधि प्रस्तावित करते हैं जो नीति सुदृढ़ता की गारंटी देता है, और विभिन्न जिम्नेजियम वातावरणों में इस विधि का प्रयोगात्मक रूप से सत्यापन करता है।