यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है। यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है। पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।
यह शोधपत्र बहुभाषी वृहद्-स्तरीय भाषा मॉडलों (LLM) के तथ्यात्मक अनुमान प्रदर्शन को बढ़ाने के लिए अनुकूली बहुभाषी विचार श्रृंखला (AdaMCOT) ढाँचा प्रस्तुत करता है। मौजूदा बहुभाषी शब्दकोश प्रशिक्षण और अंतर-भाषा ट्यूनिंग दृष्टिकोणों से जुड़ी सूक्ष्म अनुमान प्रक्रियाओं को पकड़ने में आने वाली मापनीयता संबंधी समस्याओं और कठिनाइयों का समाधान करने के लिए, AdaMCOT लक्ष्य भाषा प्रतिक्रियाएँ उत्पन्न करने के लिए एक मध्यवर्ती "विचार भाषा" से विचार प्रक्रियाओं को गतिशील रूप से रूट करता है। यह अतिरिक्त शब्दकोश प्रशिक्षण के बिना एक अनुकूली पुरस्कार-आधारित तंत्र के माध्यम से इष्टतम अनुमान पथ का चयन करता है। विभिन्न बेंचमार्क मूल्यांकनों के माध्यम से, हम प्रदर्शित करते हैं कि यह विशेष रूप से कम-संसाधन भाषा परिवेशों में, तथ्यात्मक अनुमान गुणवत्ता और अंतर-भाषा संगति में उल्लेखनीय रूप से सुधार करता है। मॉडल की गुप्त अवस्था और अर्थ-स्थान का विश्लेषण इस दृष्टिकोण के अंतर्निहित तंत्रों को स्पष्ट करता है, यह सुझाव देते हुए कि अनुकूली अनुमान पथ सांस्कृतिक और भाषाई बारीकियों को संरक्षित करते हुए उच्च और निम्न-संसाधन भाषाओं के बीच प्रदर्शन अंतर को प्रभावी ढंग से पाटता है।
Takeaways, Limitations
•
Takeaways:
◦
कम संसाधन वाली भाषाओं के तथ्यात्मक तर्क प्रदर्शन को सुधारने में प्रभावी।
◦
बेहतर अंतर-भाषा संगति.
◦
अतिरिक्त पूर्व-प्रशिक्षण के बिना अनुकूली अनुमान पथ चयन।
◦
सांस्कृतिक और भाषाई सूक्ष्मता बनाए रखना।
•
Limitations:
◦
AdaMCOT के प्रदर्शन सुधार में योगदान देने वाले विशिष्ट कारकों को निर्धारित करने के लिए आगे के विश्लेषण की आवश्यकता है।
◦
विभिन्न भाषाओं और कार्यों के लिए सामान्यीकरण प्रदर्शन सत्यापन आवश्यक है।
◦
"विचार भाषा" चयन तंत्र की अधिक पारदर्शिता और व्याख्या की आवश्यकता।