दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

क्या एलएलएम अति-पक्षपातपूर्ण, नकली, ध्रुवीकृत और हानिकारक सामग्री का पता लगाने के लिए पर्याप्त हैं? संदर्भ-आधारित शिक्षा बनाम सूक्ष्म-समायोजन का मूल्यांकन

Created by
  • Haebom

लेखक

मिशेल जोशुआ मैगिनी, धिया मर्ज़ौगुई, रबीराज बंद्योपाध्याय, गा एल डायस, फैब्रिस मौरेल, पाब्लो गैमालो

रूपरेखा

यह शोधपत्र विभिन्न मॉडलों, उपयोग विधियों और भाषाओं में, बड़े पैमाने के भाषा मॉडल (एलएलएम) के प्रदर्शन का व्यापक मूल्यांकन करता है, जो ऑनलाइन प्लेटफ़ॉर्म पर फर्जी खबरों, अत्यधिक पूर्वाग्रह और हानिकारक सामग्री के प्रसार के विरुद्ध एक प्रतिकार के रूप में ध्यान आकर्षित कर रहे हैं। दस डेटासेट और पाँच भाषाओं (अंग्रेजी, स्पेनिश, पुर्तगाली, अरबी और बल्गेरियाई) का उपयोग करते हुए, हमने बाइनरी और मल्टी-क्लास परिदृश्यों में एलएलएम अनुकूलन प्रतिमानों की प्रयोगात्मक रूप से तुलना और विश्लेषण किया। हमने विभिन्न संदर्भ-आधारित शिक्षण रणनीतियों का परीक्षण किया, जिनमें पैरामीटर-कुशल फ़ाइन-ट्यूनिंग, ज़ीरो-शॉट प्रॉम्प्ट, कोडबुक, फ़्यू-शॉट लर्निंग (यादृच्छिक चयन और डीपीपी-आधारित बहुविकल्पीय उदाहरणों सहित), और चेन-ऑफ़-थॉट शामिल हैं।

Takeaways, Limitations

Takeaways: यह शोधपत्र एलएलएम का उपयोग करके फर्जी खबरों और हानिकारक सामग्री का पता लगाने के लिए विभिन्न मॉडलों, भाषाओं और तरीकों का एक व्यापक तुलनात्मक विश्लेषण प्रस्तुत करता है। विशेष रूप से, यह कार्य-विशिष्ट फ़ाइन-ट्यूनिंग के महत्व पर प्रकाश डालता है, यहाँ तक कि छोटे मॉडलों के लिए भी, यह प्रदर्शित करके कि फ़ाइन-ट्यूनिंग संदर्भ-आधारित शिक्षण से बेहतर प्रदर्शन करती है। प्रायोगिक परिणाम प्रस्तुत किए गए हैं, जिनमें सबसे बड़े मॉडल शामिल हैं, जैसे LLaMA3.1-8b-Instruct, Mistral-Nemo-Instruct-2407, और Qwen2.5-7B-Instruct।
Limitations: इस अध्ययन में शामिल डेटासेट और भाषाएँ सभी संभावनाओं को शामिल नहीं कर सकती हैं। यह भी संभव है कि परिणाम कुछ भाषाओं या डेटासेट के प्रति पक्षपाती हों। नए प्रकार की फर्जी खबरों या हानिकारक सामग्री के लिए सामान्यीकरण क्षमता निर्धारित करने के लिए और अधिक शोध की आवश्यकता है।
👍