दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

AdaMCoT: अनुकूली बहुभाषी विचार श्रृंखला के माध्यम से पार-भाषाई तथ्यात्मक तर्क पर पुनर्विचार

Created by
  • Haebom

लेखक

वेहुआ झेंग, शिन हुआंग, झेंगयुआन लियू, तरूण कुमार वांगानी, बोवेई ज़ू, जियान ताओ, युहाओ वू, ऐ ती अव, नैन्सी एफ. चेन, रॉय का-वेई ली

रूपरेखा

यह शोधपत्र बहुभाषी वृहद्-स्तरीय भाषा मॉडलों (LLM) के तथ्यात्मक अनुमान प्रदर्शन को बढ़ाने के लिए अनुकूली बहुभाषी विचार श्रृंखला (AdaMCOT) ढाँचा प्रस्तुत करता है। मौजूदा बहुभाषी शब्दकोश प्रशिक्षण और अंतर-भाषा ट्यूनिंग दृष्टिकोणों से जुड़ी सूक्ष्म अनुमान प्रक्रियाओं को पकड़ने में आने वाली मापनीयता संबंधी समस्याओं और कठिनाइयों का समाधान करने के लिए, AdaMCOT लक्ष्य भाषा प्रतिक्रियाएँ उत्पन्न करने के लिए एक मध्यवर्ती "विचार भाषा" से विचार प्रक्रियाओं को गतिशील रूप से रूट करता है। यह अतिरिक्त शब्दकोश प्रशिक्षण के बिना एक अनुकूली पुरस्कार-आधारित तंत्र के माध्यम से इष्टतम अनुमान पथ का चयन करता है। विभिन्न बेंचमार्क मूल्यांकनों के माध्यम से, हम प्रदर्शित करते हैं कि यह विशेष रूप से कम-संसाधन भाषा परिवेशों में, तथ्यात्मक अनुमान गुणवत्ता और अंतर-भाषा संगति में उल्लेखनीय रूप से सुधार करता है। मॉडल की गुप्त अवस्था और अर्थ-स्थान का विश्लेषण इस दृष्टिकोण के अंतर्निहित तंत्रों को स्पष्ट करता है, यह सुझाव देते हुए कि अनुकूली अनुमान पथ सांस्कृतिक और भाषाई बारीकियों को संरक्षित करते हुए उच्च और निम्न-संसाधन भाषाओं के बीच प्रदर्शन अंतर को प्रभावी ढंग से पाटता है।

Takeaways, Limitations

Takeaways:
कम संसाधन वाली भाषाओं के तथ्यात्मक तर्क प्रदर्शन को सुधारने में प्रभावी।
बेहतर अंतर-भाषा संगति.
अतिरिक्त पूर्व-प्रशिक्षण के बिना अनुकूली अनुमान पथ चयन।
सांस्कृतिक और भाषाई सूक्ष्मता बनाए रखना।
Limitations:
AdaMCOT के प्रदर्शन सुधार में योगदान देने वाले विशिष्ट कारकों को निर्धारित करने के लिए आगे के विश्लेषण की आवश्यकता है।
विभिन्न भाषाओं और कार्यों के लिए सामान्यीकरण प्रदर्शन सत्यापन आवश्यक है।
"विचार भाषा" चयन तंत्र की अधिक पारदर्शिता और व्याख्या की आवश्यकता।
👍