दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

प्रतिकूल सहकारी युक्तिकरण: स्वच्छ डेटासेट में भी नकली सहसंबंधों का जोखिम

Created by
  • Haebom

लेखक

वेई लियू, झोंगयु नीउ, लैंग गाओ, झियिंग डेंग, जून वांग, हाओझाओ वांग, रुइक्सुआन ली

रूपरेखा

यह अध्ययन एक स्व-तर्कसंगतीकरण ढाँचे की जाँच करता है जिसमें एक जनरेटर और एक भविष्यवक्ता के बीच एक सहकारी खेल शामिल है। जनरेटर कच्चे इनपुट के सबसे सूचनात्मक भागों को निकालता है, और भविष्यवक्ता चयनित उपसमूह को इनपुट के रूप में उपयोग करता है। भविष्यवाणी की सटीकता को अधिकतम करने के लिए जनरेटर और भविष्यवक्ता को सहकारी रूप से प्रशिक्षित किया जाता है। यह शोधपत्र सबसे पहले एक संभावित समस्या का खुलासा करता है: सहकारी खेल अनजाने में युक्तिकरण निष्कर्षण के दौरान नमूनाकरण पूर्वाग्रह उत्पन्न कर सकता है। विशेष रूप से, जनरेटर अनजाने में चयनित युक्तिकरण उम्मीदवारों और लेबल के बीच झूठे सहसंबंध उत्पन्न कर सकता है, भले ही वे मूल डेटासेट में अर्थगत रूप से असंबंधित हों। फिर हम विस्तृत सैद्धांतिक विश्लेषण और अनुभवजन्य साक्ष्य का उपयोग करके इस पूर्वाग्रह की उत्पत्ति की व्याख्या करते हैं। हमारे परिणाम हमलों का उपयोग करके इन सहसंबंधों की जाँच करने के तरीके सुझाते हैं, और इन निष्कर्षों के आधार पर, हम भविष्यवक्ता को सहसंबंधों को सीखने से रोकने के लिए अतिरिक्त मार्गदर्शन प्रदान करते हैं। तीन नेटवर्क आर्किटेक्चर (जीआरयू, बीईआरटी और जीसीएन) का उपयोग करके छह पाठ वर्गीकरण डेटासेट और दो ग्राफ वर्गीकरण डेटासेट पर किए गए प्रयोगों से पता चलता है कि प्रस्तावित विधि हाल के युक्तिकरण विधियों से काफी बेहतर प्रदर्शन करती है और प्रतिनिधि एलएलएम (Llama3.1-8b-instruct) के बराबर या उससे बेहतर परिणाम प्राप्त करती है।

Takeaways, Limitations

Takeaways: यह शोधपत्र सहयोगात्मक स्व-तर्कसंगतीकरण ढाँचों में संभावित नमूनाकरण पूर्वाग्रह मुद्दों की पहचान करके और उनके समाधान हेतु प्रभावी समाधान सुझाकर स्व-तर्कसंगतीकरण मॉडलों की विश्वसनीयता और प्रदर्शन को बेहतर बनाने में योगदान देता है। प्रस्तावित विधि मौजूदा विधियों और प्रतिनिधि एलएलएम की तुलना में बेहतर प्रदर्शन प्रदर्शित करती है।
Limitations: प्रस्तावित विधि के सामान्यीकरण प्रदर्शन का मूल्यांकन करने के लिए और अधिक शोध की आवश्यकता है। विविध डेटासेट और आर्किटेक्चर पर व्यापक प्रयोग आवश्यक हैं। नमूनाकरण पूर्वाग्रह के मुद्दों को हल करने के लिए आगे सैद्धांतिक विश्लेषण की आवश्यकता है।
👍