दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

एलएलएम से परे अनुकूलित वार्तालाप: एक आरएल-आधारित संवाद प्रबंधक

Created by
  • Haebom

लेखक

लूसी गैलंड, कैथरीन पेलाचौड, फ्लोरियन पेक्यून

रूपरेखा

इस पत्र में, हम एक नवीन ढाँचे का प्रस्ताव करते हैं जो लक्ष्य-उन्मुख मुक्त-अंत वार्तालापों के लिए एक बड़े पैमाने के भाषा मॉडल (एलएलएम) और एक सुदृढीकरण अधिगम-आधारित संवाद प्रबंधक को एकीकृत करता है। किसी वार्तालाप के संरचनात्मक चरणों को मॉडल करने के लिए पदानुक्रमित सुदृढीकरण अधिगम और विभिन्न उपयोगकर्ता प्रोफ़ाइलों के लिए इसकी अनुकूलनशीलता को बढ़ाने हेतु मेटा-लर्निंग का लाभ उठाकर, हम सीमित आँकड़ों से सीख सकते हैं, वार्तालाप चरणों के बीच सहज रूप से संक्रमण कर सकते हैं, और विषम उपयोगकर्ता आवश्यकताओं के अनुसार प्रतिक्रियाओं को वैयक्तिकृत कर सकते हैं। व्यवहार परिवर्तन को बढ़ावा देने के लिए प्रेरक साक्षात्कारों में अपने ढाँचे को लागू करके, हम प्रदर्शित करते हैं कि प्रस्तावित संवाद प्रबंधक पुरस्कारों के मामले में अत्याधुनिक एलएलएम बेसलाइन मॉडल से बेहतर प्रदर्शन करता है, जिससे लक्ष्य-उन्मुख मुक्त-अंत वार्तालाप प्रणालियाँ बनाने के लिए एलएलएम कंडीशनिंग के संभावित लाभों का प्रदर्शन होता है।

Takeaways, Limitations

Takeaways:
लक्ष्य-उन्मुख खुली संवाद प्रणालियों के विकास के लिए एक नया ढांचा
पदानुक्रमित सुदृढीकरण सीखने और मेटा-लर्निंग के माध्यम से कुशल और अनुकूली वार्तालाप प्रबंधन
सीमित डेटा के साथ भी प्रभावी शिक्षण और व्यक्तिगत प्रतिक्रियाएँ संभव
प्रेरक साक्षात्कार जैसे विशिष्ट लक्ष्यों के साथ संवादात्मक प्रणालियों में एलएलएम बेसलाइन मॉडल पर बेहतर प्रदर्शन प्रदर्शित करता है।
Limitations:
प्रस्तावित ढांचे के सामान्यीकरण प्रदर्शन और विभिन्न लक्ष्य-उन्मुख संवाद प्रणालियों पर इसकी प्रयोज्यता पर आगे अनुसंधान की आवश्यकता है।
उपयोग किए गए डेटासेट के आकार और विविधता के अनुसार प्रदर्शन प्रभाव का विश्लेषण करने की आवश्यकता
वास्तविक उपयोगकर्ताओं के साथ बातचीत के माध्यम से अतिरिक्त मूल्यांकन की आवश्यकता है।
परिणाम एक विशिष्ट डोमेन (प्रेरक साक्षात्कार) तक सीमित हैं, तथा अन्य डोमेन के लिए सामान्यीकरण की पुष्टि की आवश्यकता है।
👍