दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

इरादों से बातचीत तक: बहु-बारी वर्गीकरण के लिए विपरीत शिक्षण के साथ इरादे-संचालित संवाद उत्पन्न करना

Created by
  • Haebom

लेखक

जुनहुआ लियू, योंग कीट टैन, बिन फू, क्वान हुई लिम

रूपरेखा

बड़े पैमाने पर, डोमेन-विशिष्ट बहुभाषी वार्तालाप डेटासेट उत्पन्न करने की चुनौतियों का समाधान करने के लिए, यह शोधपत्र Chain-of-Intent प्रस्तुत करता है, जो एक नया ढाँचा है जो हिडन मार्कोव मॉडल (HMM) और लार्ज-स्केल लैंग्वेज मॉडल (LLM) को एकीकृत करता है। Chain-of-Intent वास्तविक दुनिया के ई-कॉमर्स चैट लॉग से डोमेन-विशिष्ट आशय संक्रमण पैटर्न निकालता है और उनका उपयोग राउंड-बाय-राउंड डायनेमिक्स और आशय अनुक्रमों को मॉडल करने के लिए करता है। इसके बाद, यह LLM का उपयोग करके HMM की उत्सर्जन संभावनाओं को पैरामीटराइज़ करता है ताकि प्राकृतिक और सुसंगत उच्चारण उत्पन्न हों जो अनुमानित आशय और वार्तालाप संदर्भ के साथ संरेखित हों। इसके अलावा, हम MINT-CL का प्रस्ताव करते हैं, जो एक बहु-कार्य कंट्रास्टिव लर्निंग ढाँचा है जो बड़े एनोटेटेड डेटासेट पर निर्भरता को कम करते हुए प्रदर्शन में सुधार करता है। प्रायोगिक परिणाम दर्शाते हैं कि प्रस्तावित विधि, विशेष रूप से बहुभाषी परिवेशों में, संवाद निर्माण गुणवत्ता और वर्गीकरण सटीकता, दोनों में प्रतिस्पर्धी आधारभूत मॉडलों से बेहतर प्रदर्शन करती है। अंत में, हम भविष्य के अनुसंधान के लिए ई-कॉमर्स डोमेन से प्राप्त एक व्यापक बहुभाषी, आशय-जागरूक बहु-दौर वार्तालाप कोष, MINT-E जारी करते हैं।

____T12110_____, ____T12111_____

Takeaways:
प्रभावी बहुभाषी, बहु-पास आशय वर्गीकरण मॉडलों के प्रशिक्षण के लिए बड़े पैमाने पर डेटासेट तैयार करने की समस्या को हल करने के लिए एचएमएम और एलएलएम को संयोजित करना।
MINT-CL के साथ बड़े एनोटेटेड डेटासेट पर निर्भरता कम करना और बेहतर प्रदर्शन प्राप्त करना।
बहुभाषी, बहु-सत्र वार्तालाप कोष MINT-E के विमोचन के माध्यम से भावी अनुसंधान को प्रोत्साहित करना।
यह ई-कॉमर्स से परे विभिन्न डोमेन पर प्रयोज्यता का सुझाव देता है।
Limitations:
वास्तविक ई-कॉमर्स चैट लॉग पर अत्यधिक निर्भरता के कारण, लॉग डेटा की गुणवत्ता से प्रदर्शन प्रभावित हो सकता है।
यह एलएलएम के प्रदर्शन पर निर्भर करता है, और एलएलएम की सीमाएं चेन-ऑफ-इंटेंट के प्रदर्शन को प्रभावित कर सकती हैं।
MINT-E डेटासेट के आकार और विविधता की आगे समीक्षा की आवश्यकता है।
अन्य डोमेन में सामान्यीकरण प्रदर्शन निर्धारित करने के लिए आगे और प्रयोगों की आवश्यकता है।
👍