दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

ड्रीम टू चैट: उपयोगकर्ता विश्वास मॉडलिंग के साथ संवाद पर मॉडल-आधारित सुदृढीकरण सीखना

Created by
  • Haebom

लेखक

यू झाओ, ज़ियाओयू वांग, डैन वांग, झोंगलिन जियांग, किंगकिंग गु, टेंग चेन, निंगयुआन शी, जिंक्सियन क्व, योंग चेन, लुओ जी

रूपरेखा

यह शोधपत्र रोबोटिक्स, गेम्स और स्वचालित ड्राइविंग में व्यापक रूप से उपयोग किए जाने वाले विश्व मॉडलों को प्राकृतिक भाषा प्रसंस्करण, विशेष रूप से, संवादी प्रणालियों पर लागू करता है। हम उपयोगकर्ता की भावनाओं, मनोभावों, इरादों और भविष्य के कथनों का पूर्वानुमान लगाने के लिए एक संवादी विश्व मॉडल का निर्माण करते हैं। हम भावनाओं, मनोभावों और इरादों को उपयोगकर्ता के विश्वासों के रूप में मॉडल करने के लिए एक आंशिक रूप से अवलोकनीय मार्कोव निर्णय प्रक्रिया (POMDP) ​​को परिभाषित करते हैं, और उन्हें अधिकतम करके सूचना अवरोधों को हल करने की एक विधि प्रस्तावित करते हैं। इस उपयोगकर्ता विश्वास मॉडलिंग के आधार पर, हम संवादी प्रणाली पर एक मॉडल-आधारित सुदृढीकरण अधिगम ढाँचा लागू करते हैं, और ड्रीमक्यूब नामक एक नवीन ढाँचा प्रस्तुत करते हैं। प्रायोगिक परिणाम प्रदर्शित करते हैं कि पूर्व-प्रशिक्षित संवादी विश्व मॉडल भावना वर्गीकरण और भावना पहचान में अत्याधुनिक प्रदर्शन प्राप्त करता है। इसके अलावा, नीति, आलोचक और संवादी विश्व मॉडलों के संयुक्त प्रशिक्षण से संवादी गुणवत्ता में सुधार होता है। आगे के विश्लेषण से पता चलता है कि प्रस्तावित विधि एक उचित अन्वेषण-शोषण संतुलन बनाए रखती है और गैर-डोमेन परिदृश्यों, जैसे कि सहानुभूतिपूर्ण वार्तालापों, में उत्कृष्ट स्थानांतरणीयता प्रदर्शित करती है।

Takeaways, Limitations

Takeaways:
हम एक नया ढांचा (ड्रीमक्यूब) प्रस्तुत करते हैं जो एक संवादात्मक प्रणाली पर विश्व मॉडल लागू करके उपयोगकर्ताओं की भावनाओं, मनोभावों और इरादों का प्रभावी ढंग से पूर्वानुमान लगा सकता है और उनका मॉडल तैयार कर सकता है।
भावना वर्गीकरण और भावना पहचान में अत्याधुनिक प्रदर्शन प्राप्त करना।
बातचीत की गुणवत्ता में सुधार और अन्वेषण एवं लाभ उठाने के बीच सही संतुलन बनाए रखना।
डोमेन से बाहर के परिदृश्यों में उत्कृष्ट स्थानांतरण प्रदर्शन।
Limitations:
इस पेपर में प्रस्तुत ड्रीमक्यूब फ्रेमवर्क के वास्तविक कार्यान्वयन और मापनीयता पर विवरण का अभाव है।
विभिन्न वार्तालाप प्रकारों और पैमानों पर सामान्यीकरण प्रदर्शन के आगे सत्यापन की आवश्यकता है।
पीओएमडीपी-आधारित उपयोगकर्ता विश्वास मॉडलिंग की सीमाओं और सुधार के लिए दिशा-निर्देशों पर चर्चा का अभाव।
सूचना बाधा अधिकतमीकरण रणनीतियों के लिए विशिष्ट एल्गोरिदम और पैरामीटर सेटिंग्स के विस्तृत विवरण का अभाव।
👍