दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

एलएलएम का दिल पत्थर का होता है: बड़े तर्क मॉडल की कोमल सोच क्षमता का रहस्य उजागर करना

Created by
  • Haebom

लेखक

चुनहुंग वू, जिनलियांग लू, ज़िक्सुआन रेन, गैंगकियांग हू, ज़ी वू, दाई दाई, हुआ वू

रूपरेखा

यह शोधपत्र विभिन्न अन्वेषण तकनीकों का उपयोग करते हुए बड़े पैमाने के भाषा मॉडल (एलएलएम) की "सॉफ्ट थिंकिंग" क्षमताओं का विश्लेषण करता है। सॉफ्ट थिंकिंग के बारे में पारंपरिक अपेक्षाओं के विपरीत, हम पाते हैं कि एलएलएम मुख्य रूप से सॉफ्ट टोकन के सबसे प्रभावशाली घटकों पर निर्भर करते हैं, जिससे उनका अनुमान पथ अन्वेषण सीमित हो जाता है। यह लालची डिकोडिंग के समान है, जो सॉफ्ट टोकन के माध्यम से अधिक जानकारी संप्रेषित करने के लाभ को अस्पष्ट कर देता है। इस समस्या का समाधान करने के लिए, हम डिरिचलेट रीसैंपलिंग और गम्बेल-सॉफ्टमैक्स तकनीक जैसी नमूनाकरण रणनीतियों के माध्यम से यादृच्छिकता का परिचय देते हैं, और प्रयोगात्मक रूप से आठ अनुमान मानकों पर उनकी प्रभावशीलता का सत्यापन करते हैं। हम पुष्टि करते हैं कि गम्बेल-सॉफ्टमैक्स तकनीक उचित यादृच्छिकता और नियंत्रित सहजता प्रदान करके सर्वोत्तम प्रदर्शन प्राप्त करती है।

Takeaways, Limitations

Takeaways: हम प्रदर्शित करते हैं कि सॉफ्ट टोकन का उपयोग करके सॉफ्ट रीजनिंग को सरल लालची डिकोडिंग तक सीमित किया जा सकता है, और सुझाव देते हैं कि नमूनाकरण रणनीतियों (विशेष रूप से, गम्बेल-सॉफ्टमैक्स) में यादृच्छिकता लाकर प्रदर्शन में सुधार किया जा सकता है। इससे एलएलएम अनुमान प्रक्रिया की हमारी समझ गहरी होती है और सॉफ्ट रीजनिंग के प्रभावी उपयोग के तरीके सुझाए जाते हैं।
Limitations: प्रस्तावित नमूनाकरण रणनीति की प्रभावशीलता एक विशिष्ट बेंचमार्क तक सीमित हो सकती है, और अन्य प्रकार के एलएलएम या अनुमान कार्यों में इसकी सामान्यता पर और शोध की आवश्यकता है। इसके अलावा, यादृच्छिकता लागू करने से हमेशा प्रदर्शन में सुधार नहीं होता है, और यादृच्छिकता का इष्टतम स्तर निर्धारित करना एक चुनौती बना हुआ है।
👍