दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

एलएलएम एकल-सूत्रीय तर्ककर्ता हैं: सॉफ्ट थिंकिंग की कार्यप्रणाली का रहस्य उजागर करना

Created by
  • Haebom

लेखक

चुनहुंग वू, जिनलियांग लू, ज़िक्सुआन रेन, गैंगकियांग हू, ज़ी वू, दाई दाई, हुआ वू

रूपरेखा

यह शोधपत्र विभिन्न अन्वेषण तकनीकों का उपयोग करते हुए बड़े पैमाने के भाषा मॉडल (एलएलएम) की "सॉफ्ट थिंकिंग" क्षमताओं की जाँच करता है। सॉफ्ट थिंकिंग का उद्देश्य एक सतत अवधारणा स्थान में अनुमान को सुगम बनाने के लिए सॉफ्ट टोकन उत्पन्न करना है। पारंपरिक ज्ञान के विपरीत, हम पाते हैं कि एलएलएम बाद के डिकोडिंग के दौरान मुख्य रूप से सॉफ्ट इनपुट के सबसे प्रभावशाली घटकों पर निर्भर करते हैं, जिससे विविध अनुमान पथों के अन्वेषण में बाधा उत्पन्न होती है। इस सीमा को पार करने के लिए, हम डिरिचलेट रीसैंपलिंग और गम्बेल-सॉफ्टमैक्स तकनीक जैसी नमूनाकरण रणनीतियों के माध्यम से यादृच्छिकता का परिचय देते हैं, जिसका उद्देश्य सॉफ्ट थिंकिंग की क्षमता को उजागर करना है। प्रायोगिक परिणाम दर्शाते हैं कि गम्बेल-सॉफ्टमैक्स तकनीक आठ अनुमान मानदंडों पर गम्बेल-सॉफ्टमैक्स तकनीक से बेहतर प्रदर्शन करती है।

Takeaways, Limitations

Takeaways:
एलएलएम में सॉफ्ट थिंकिंग कौशल की गहन समझ प्रदान करता है।
मौजूदा सॉफ्ट थिंकिंग विधि के Limitations (सीमित अन्वेषण पथ) की पहचान करना।
यादृच्छिकता को शामिल करके सॉफ्ट थिंकिंग प्रदर्शन में सुधार की संभावना का सुझाव देना।
गम्बेल-सॉफ्टमैक्स तकनीक की प्रभावशीलता का सत्यापन।
Limitations:
सीमित बेंचमार्क का उपयोग (8).
अन्य नमूनाकरण रणनीतियों पर आगे अनुसंधान की आवश्यकता है।
विभिन्न एलएलएम आर्किटेक्चर के लिए सामान्यीकरण सत्यापन की आवश्यकता है।
👍