दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

क्या एलएलएम की विचार-श्रृंखलाबद्ध तर्क-प्रणाली एक मृगतृष्णा है? एक डेटा वितरण लेंस

Created by
  • Haebom

लेखक

चेंगशुई झाओ, जेन टैन, पिंगचुआन मा, दावेई ली, बोहन जियांग, यानचेंग वांग, यिंगजेन यांग, हुआन लियू

रूपरेखा

यह शोधपत्र डेटा वितरण के दृष्टिकोण से चेन-ऑफ-थॉट (CoT) प्रॉम्प्टिंग के माध्यम से लार्ज लैंग्वेज मॉडल्स (LLMs) के प्रदर्शन सुधार का विश्लेषण करता है। हम जाँच करते हैं कि क्या CoT अनुमान प्रशिक्षण डेटा से सीखे गए संरचनात्मक आगमनात्मक पूर्वाग्रहों को दर्शाता है, जिससे सशर्त निर्माण संभव होता है जो प्रशिक्षण के दौरान देखे गए अनुमान पथों का अनुमान लगाता है। इसे प्राप्त करने के लिए, हम DataAlchemy डिज़ाइन करते हैं, एक नियंत्रित वातावरण जहाँ हम LLMs को शुरू से प्रशिक्षित करते हैं और विभिन्न वितरण स्थितियों की व्यवस्थित रूप से जाँच करते हैं। हम CoT अनुमान का विश्लेषण तीन आयामों में करते हैं: कार्य, लंबाई और प्रारूप। हमारे परिणाम बताते हैं कि CoT अनुमान एक नाजुक घटना है जो प्रशिक्षण वितरण के बाहर गायब हो जाती है, जो वास्तव में सामान्यीकृत अनुमान प्राप्त करने की कठिनाई को उजागर करती है।

Takeaways, Limitations

Takeaways: डेटा वितरण के दृष्टिकोण से CoT अनुमान की सीमाओं को उजागर करके, हम LLM की अनुमान क्षमताओं की गहन समझ प्रदान करते हैं। हमारा सुझाव है कि CoT प्रॉम्प्टिंग की प्रभावशीलता मूल रूप से प्रशिक्षण डेटा और परीक्षण क्वेरीज़ के बीच वितरण संबंधी बेमेल की मात्रा द्वारा सीमित है। हम डेटाएल्केमी जैसे नियंत्रित वातावरण का उपयोग करके LLM के अनुमान तंत्र का व्यवस्थित विश्लेषण करने के लिए एक पद्धति प्रस्तुत करते हैं।
Limitations: डेटाएल्केमी परिवेश विशिष्ट परिस्थितियों में प्रायोगिक परिणामों पर आधारित है, इसलिए जटिल वास्तविक-विश्व परिवेशों में इसकी सामान्यता निर्धारित करने के लिए और अधिक शोध की आवश्यकता है। विश्लेषण कुछ आयामों (कार्य, लंबाई, प्रारूप) तक सीमित है, और अन्य महत्वपूर्ण कारकों के प्रभाव पर विचार नहीं किया गया हो सकता है। CoT अनुमान की अंतर्निहित सीमाओं को पूरी तरह से स्पष्ट करने के लिए और अधिक शोध की आवश्यकता है।
👍