[공지사항]을 빙자한 안부와 근황 
Show more

दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

सुरक्षित संख्यात्मक योजना क्रिया मॉडल सीखना

Created by
  • Haebom

लेखक

अर्गमन मोर्डोक, शहाफ़ एस. शपरबर्ग, रोनी स्टर्न, बर्नडन जुबा

रूपरेखा

यह शोधपत्र एक ऐसे नियोजन मॉडल को प्राप्त करने की महत्वपूर्ण चुनौती का समाधान करता है जो वास्तविक दुनिया की समस्याओं पर नियोजन तकनीकों के अनुप्रयोग में समस्या की गतिशीलता का सटीक प्रतिनिधित्व करता हो। यह विशेष रूप से उन मिशन-महत्वपूर्ण क्षेत्रों में कठिन है जहाँ परीक्षण-और-त्रुटि अधिगम असंभव है। इसलिए, नियोजन के लिए प्रयुक्त क्रिया मॉडल सुरक्षित होना चाहिए, और उत्पन्न योजना लागू होनी चाहिए और लक्ष्य को प्राप्त करनी चाहिए। पिछले अध्ययनों ने मुख्य रूप से उन क्षेत्रों में सुरक्षित क्रिया मॉडल अधिगम का अध्ययन किया है जहाँ अवस्थाओं को बूलियन चरों द्वारा पर्याप्त रूप से वर्णित किया जा सकता है। इस शोधपत्र में, हम एक संख्यात्मक रूप से सुरक्षित क्रिया मॉडल अधिगम (N-SAM) एल्गोरिथम प्रस्तावित करते हैं जो इन सीमाओं को पार करता है और सुरक्षित संख्यात्मक पूर्ववृत्तों और प्रभावों को सीख सकता है। N-SAM प्रेक्षणों की संख्या के संबंध में रैखिक समय में चलता है और कुछ शर्तों के तहत सुरक्षित क्रिया मॉडल लौटाने की गारंटी देता है। हालाँकि, इस सुरक्षा गारंटी को बनाए रखने के लिए, सीखे गए मॉडल में क्रिया को शामिल करने से पहले प्रत्येक क्रिया के पर्याप्त उदाहरणों का प्रेक्षण किया जाना चाहिए। N-SAM की इस सीमा का समाधान करने के लिए, यह शोधपत्र एक N-SAM* एल्गोरिथम प्रस्तावित करता है जो यह सुनिश्चित करता है कि प्रत्येक प्रेक्षित क्रिया कम से कम कुछ अवस्थाओं में लागू हो। एन-एसएएम में केवल एक बार देखी जाने वाली क्रियाएँ शामिल होती हैं और सुरक्षा से समझौता नहीं करतीं। सुरक्षा की गारंटी देने वाले अन्य एल्गोरिदम की तुलना में नमूना जटिलता के संदर्भ में एन-एसएएम सर्वोत्तम सिद्ध हुआ है। एन-एसएएम और एन-एसएएम* का मूल्यांकन संख्यात्मक प्रोग्रामिंग डोमेन बेंचमार्क की एक विस्तृत श्रृंखला पर किया जाता है और अत्याधुनिक संख्यात्मक क्रिया मॉडल लर्निंग एल्गोरिदम से तुलना की जाती है। इसके अलावा, हम सीखने की प्रक्रिया पर संख्यात्मक सटीकता के प्रभाव पर एक चर्चा प्रदान करते हैं।

____T309_____, Limitations

Takeaways:
हम एक सुरक्षित एक्शन मॉडल लर्निंग एल्गोरिदम (एन-एसएएम, एन-एसएएम*) प्रस्तुत करते हैं जो संख्यात्मक पूर्वशर्तों और प्रभावों को सीख सकता है।
एन-एसएएम* सुरक्षा बनाए रखते हुए सीमित डेटा के साथ सुरक्षित मॉडल सीख सकता है।
एन-एसएएम* की नमूना जटिलता इष्टतमता का प्रमाण।
व्यापक बेंचमार्क के माध्यम से एल्गोरिदम प्रदर्शन का मूल्यांकन करें और संख्यात्मक सटीकता के प्रभाव का विश्लेषण करें।
Limitations:
एन-एसएएम को सुरक्षा सुनिश्चित करने के लिए प्रत्येक क्रिया के लिए कई उदाहरणों की आवश्यकता होती है।
वास्तविक दुनिया की समस्याओं के लिए प्रयोज्यता और सामान्यीकरण प्रदर्शन पर आगे अनुसंधान की आवश्यकता है।
👍