[공지사항]을 빙자한 안부와 근황 
Show more

दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

फ्लाई, फेल, फिक्स: रीइनफोर्समेंट लर्निंग और बड़े मल्टीमॉडल मॉडल के साथ पुनरावृत्तीय गेम रिपेयर

Created by
  • Haebom

लेखक

एलेक्स ज़ूक, जोसेफ स्पजुट, जोनाथन ट्रेमब्ले

रूपरेखा

यह शोधपत्र एक स्वचालित गेम डिज़ाइन पुनरावृत्ति ढाँचा प्रस्तुत करता है जो यह समझने पर केंद्रित है कि किसी गेम के स्थिर नियम और विषय-वस्तु गतिशील खिलाड़ी व्यवहार में कैसे परिवर्तित होते हैं। यह एक सुदृढीकरण अधिगम (RL) एजेंट द्वारा गेम का परीक्षण करने और एक बड़े बहुविध मॉडल (LMM) द्वारा एजेंट के व्यवहार के आधार पर गेम को संशोधित करने के द्वारा कार्य करता है। RL एजेंट कई एपिसोड पूरे करता है, संख्यात्मक प्ले मेट्रिक्स या हाल के वीडियो फ़्रेमों का सारांश प्रस्तुत करने वाली इमेज स्ट्रिप्स उत्पन्न करता है। LMM एक गेमप्ले लक्ष्य और वर्तमान गेम कॉन्फ़िगरेशन प्राप्त करता है, प्ले ट्रेस का विश्लेषण करता है, और लक्ष्य की ओर भविष्य की क्रियाओं का मार्गदर्शन करने के लिए कॉन्फ़िगरेशन को संशोधित करता है। प्रायोगिक परिणाम दर्शाते हैं कि LMM, RL एजेंट द्वारा प्रदान किए गए एक्शन ट्रेस का उपयोग करके गेम मैकेनिक्स को पुनरावृत्त रूप से बेहतर बना सकता है, जो AI-सहायता प्राप्त गेम डिज़ाइन के लिए एक व्यावहारिक और मापनीय उपकरण प्रस्तुत करता है।

____T30370_____, Limitations

Takeaways:
गेम डिजाइन की दक्षता को स्वचालित करने और सुधारने की क्षमता को प्रदर्शित करने के लिए सुदृढीकरण सीखने और बड़े पैमाने पर मल्टीमॉडल मॉडल का संयोजन।
एआई-आधारित गेम डिज़ाइन टूल विकसित करने के लिए व्यावहारिक दिशा-निर्देश प्रदान करना।
गेम खिलाड़ियों के व्यवहार संबंधी डेटा का प्रभावी ढंग से विश्लेषण करने और उसे गेम डिजाइन में प्रतिबिंबित करने की विधि प्रस्तुत करता है।
Limitations:
एलएमएम के प्रदर्शन और सामान्यीकरण क्षमता पर आगे अनुसंधान की आवश्यकता है।
विभिन्न खेल शैलियों और जटिलताओं के लिए प्रयोज्यता को सत्यापित करने की आवश्यकता है।
आरएल एजेंटों और एलएमएम के बीच बातचीत और सूचना हस्तांतरण की दक्षता में सुधार करने की आवश्यकता है।
वर्तमान में प्रस्तुत फ्रेमवर्क की मापनीयता और वास्तविक गेम विकास वातावरण में इसकी प्रयोज्यता पर आगे अनुसंधान की आवश्यकता है।
👍