यह शोधपत्र एक ऐसे नियोजन मॉडल को प्राप्त करने की महत्वपूर्ण चुनौती का समाधान करता है जो वास्तविक दुनिया की समस्याओं पर नियोजन तकनीकों के अनुप्रयोग में समस्या की गतिशीलता का सटीक प्रतिनिधित्व करता हो। यह विशेष रूप से उन मिशन-महत्वपूर्ण क्षेत्रों में कठिन है जहाँ परीक्षण-और-त्रुटि अधिगम असंभव है। इसलिए, नियोजन के लिए प्रयुक्त क्रिया मॉडल सुरक्षित होना चाहिए, और उत्पन्न योजना लागू होनी चाहिए और लक्ष्य को प्राप्त करनी चाहिए। पिछले अध्ययनों ने मुख्य रूप से उन क्षेत्रों में सुरक्षित क्रिया मॉडल अधिगम का अध्ययन किया है जहाँ अवस्थाओं को बूलियन चरों द्वारा पर्याप्त रूप से वर्णित किया जा सकता है। इस शोधपत्र में, हम एक संख्यात्मक रूप से सुरक्षित क्रिया मॉडल अधिगम (N-SAM) एल्गोरिथम प्रस्तावित करते हैं जो इन सीमाओं को पार करता है और सुरक्षित संख्यात्मक पूर्ववृत्तों और प्रभावों को सीख सकता है। N-SAM प्रेक्षणों की संख्या के संबंध में रैखिक समय में चलता है और कुछ शर्तों के तहत सुरक्षित क्रिया मॉडल लौटाने की गारंटी देता है। हालाँकि, इस सुरक्षा गारंटी को बनाए रखने के लिए, सीखे गए मॉडल में क्रिया को शामिल करने से पहले प्रत्येक क्रिया के पर्याप्त उदाहरणों का प्रेक्षण किया जाना चाहिए। N-SAM की इस सीमा का समाधान करने के लिए, यह शोधपत्र एक N-SAM* एल्गोरिथम प्रस्तावित करता है जो यह सुनिश्चित करता है कि प्रत्येक प्रेक्षित क्रिया कम से कम कुछ अवस्थाओं में लागू हो। एन-एसएएम में केवल एक बार देखी जाने वाली क्रियाएँ शामिल होती हैं और सुरक्षा से समझौता नहीं करतीं। सुरक्षा की गारंटी देने वाले अन्य एल्गोरिदम की तुलना में नमूना जटिलता के संदर्भ में एन-एसएएम सर्वोत्तम सिद्ध हुआ है। एन-एसएएम और एन-एसएएम* का मूल्यांकन संख्यात्मक प्रोग्रामिंग डोमेन बेंचमार्क की एक विस्तृत श्रृंखला पर किया जाता है और अत्याधुनिक संख्यात्मक क्रिया मॉडल लर्निंग एल्गोरिदम से तुलना की जाती है। इसके अलावा, हम सीखने की प्रक्रिया पर संख्यात्मक सटीकता के प्रभाव पर एक चर्चा प्रदान करते हैं।