दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

छोटे-बड़े भाषा मॉडल संगतता सत्यापन के माध्यम से सहयोगात्मक रुख का पता लगाना

Created by
  • Haebom

लेखक

यू यान, शेंग सन, ज़िक्सियांग तांग, तेली लियू, मिन लियू

रूपरेखा

यह शोधपत्र लघु-वृहद भाषा मॉडल संगति सत्यापन (CoVer) के माध्यम से सहयोगात्मक रुख पहचान का प्रस्ताव करता है। यह एक नवीन ढाँचा है जो वृहद भाषा मॉडल (LLM) पर निर्भरता कम करता है और सोशल मीडिया पर रुख पहचान (किसी विशिष्ट लक्ष्य के बारे में ट्वीट में व्यक्त दृष्टिकोणों की पहचान) की दक्षता में सुधार करता है। CoVer, LLM और लघु-स्तरीय भाषा मॉडल (SLM) के बीच सहयोग के माध्यम से संदर्भ-साझा बैच अनुमान और तार्किक सत्यापन करता है। LLM रुख पूर्वानुमान और स्पष्टीकरण उत्पन्न करने के लिए पाठ को बैचों में संसाधित करता है, जबकि SLM संदर्भगत शोर के कारण होने वाले पूर्वाग्रह को दूर करने के लिए तार्किक संगति का सत्यापन करता है। कम संगति वाले पाठों को पिछले LLM पूर्वानुमानों के संगति-भारित एकत्रीकरण का उपयोग करके वर्गीकृत किया जाता है। प्रायोगिक परिणाम दर्शाते हैं कि CoVer शून्य-शॉट सेटिंग्स में कई बेंचमार्क पर अत्याधुनिक विधियों से बेहतर प्रदर्शन करता है, जिससे प्रदर्शन में उल्लेखनीय सुधार होता है और प्रति ट्वीट LLM क्वेरीज़ की संख्या 0.54 तक कम हो जाती है। यह सोशल मीडिया रुख पहचान के लिए LLM को तैनात करने का एक अधिक व्यावहारिक समाधान प्रदान करता है।

Takeaways, Limitations

Takeaways:
हम एलएलएम निर्भरता को कम करते हुए रुख पहचान प्रदर्शन में सुधार करने के लिए एक कुशल ढांचा प्रस्तुत करते हैं।
प्रति ट्वीट एलएलएम प्रश्नों की संख्या कम करके लागत कम करें और उपयोगिता बढ़ाएं।
शून्य-शॉट सेटिंग्स में अत्याधुनिक प्रदर्शन प्राप्त करना।
एलएलएम और एसएलएम के बीच सहयोग के माध्यम से पूरक शक्तियों का लाभ उठाना।
Limitations:
CoVer का प्रदर्शन SLM के प्रदर्शन से प्रभावित हो सकता है।
विभिन्न सोशल मीडिया प्लेटफार्मों और भाषाओं में सामान्यीकरण का निर्धारण करने के लिए आगे अनुसंधान की आवश्यकता है।
विशिष्ट प्रकार के शोर या अस्पष्ट संदर्भों के प्रति संवेदनशीलता का आकलन करने की आवश्यकता है।
एलएलएम और एसएलएम के इष्टतम संयोजन और पैरामीटर सेटिंग्स पर आगे अनुसंधान की आवश्यकता है।
👍