दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

इनपुट योजनाओं से सीखने की कार्रवाई लागत पर

Created by
  • Haebom

लेखक

मारियानेला मोरालेस, अल्बर्टो पॉज़ेंको, ग्यूसेप कैनोनाको, श्रीराम गोपालकृष्णन, डैनियल बोरराजो, मैनुएला वेलोसो

रूपरेखा

यह शोधपत्र व्यवहार मॉडल अधिगम में क्रिया गतिशीलता सीखने के बजाय, क्रिया लागत सीखने पर केंद्रित है। नियोजन कार्यों के लिए मान्य योजनाएँ निर्दिष्ट करने पर केंद्रित पिछले अध्ययनों के विपरीत, यह शोधपत्र एक नई समस्या प्रस्तुत करता है: क्रिया लागतों के एक ऐसे समूह को सीखना जो यह सुनिश्चित करता है कि परिणामी नियोजन मॉडल के अंतर्गत इनपुट योजनाओं का एक समूह इष्टतम हो। इस समस्या के समाधान के लिए, हम $LACFIP^k$, एक एल्गोरिथम प्रस्तावित करते हैं जो बिना लेबल वाली इनपुट योजनाओं से क्रिया लागत सीखता है। हम सैद्धांतिक और प्रायोगिक परिणामों के माध्यम से $LACFIP^k$ के सफल निष्पादन को प्रदर्शित करते हैं।

Takeaways, Limitations

Takeaways:
क्रिया लागत अधिगम नामक एक नई समस्या प्रस्तुत करना तथा उसका समाधान सुझाना।
यह सिद्ध करना कि $LACFIP^k$ एल्गोरिथम का उपयोग करके लेबल रहित डेटा से लागत प्रभावी ढंग से क्रियाएं सीखना संभव है।
इष्टतम योजना के लिए कार्रवाई लागत सीखने के क्षेत्र में एक नई शोध दिशा।
Limitations:
$LACFIP^k$ एल्गोरिथम के प्रदर्शन और सामान्यीकरण क्षमता पर आगे अनुसंधान की आवश्यकता है।
विभिन्न नियोजन समस्याओं और व्यवहार मॉडलों के लिए प्रयोज्यता सत्यापन आवश्यक है।
वास्तविक दुनिया की समस्याओं के लिए प्रयोज्यता और मापनीयता पर आगे अनुसंधान की आवश्यकता है।
👍