दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

आपके अंदर कई भेड़िये हैं: LLM में मूल्य व्यापार-नापसंद की व्याख्या करने के लिए संज्ञानात्मक मॉडल का उपयोग करना

Created by
  • Haebom

लेखक

सोनिया के. मूर्ति, रोज़ी झाओ, जेनिफर हू, शाम काकाडे, मार्कस वुल्फमीयर, पेंग कियान, तोमर उल्मन

रूपरेखा

यह शोधपत्र जांचता है कि बड़े पैमाने पर भाषा मॉडल (LLM) रोज़मर्रा की सामाजिक स्थितियों में परस्पर विरोधी लक्ष्यों (जैसे, ठंडा सच बताना, विश्वास बनाए रखना और दूसरे पक्ष की भावनाओं पर विचार करना) के बीच मूल्य व्यापार-नापसंद से कैसे निपटते हैं। संज्ञानात्मक विज्ञान के "संज्ञानात्मक मॉडल" का उपयोग करते हुए, हम इस बात का आकलन करते हैं कि LLM किस हद तक मानव-समान मूल्य व्यापार-नापसंद प्रदर्शित करते हैं। हम दो सेटिंग्स में मूल्य व्यापार-नापसंद का व्यवस्थित रूप से मूल्यांकन करते हैं: अत्याधुनिक ब्लैक-बॉक्स मॉडल का अनुमान "प्रयास" स्तर और ओपन-सोर्स मॉडल का सुदृढीकरण सीखने के बाद प्रशिक्षण की गतिशीलता। नतीजतन, अनुमान मॉडल में सूचनात्मक उपयोगिता सामाजिक उपयोगिता से अधिक है, और इस प्रवृत्ति की पुष्टि बेहतर गणितीय तर्क क्षमता वाले ओपन-सोर्स मॉडल में भी होती है। LLM के प्रशिक्षण की गतिशीलता के विश्लेषण से शुरुआती प्रशिक्षण चरण में उपयोगिता मूल्यों में बड़े बदलाव और बेस मॉडल और प्री-ट्रेनिंग डेटा चयन के लगातार प्रभावों का पता चलता है। यह अध्ययन विभिन्न पहलुओं में एलएलएम के विकास को दर्शाता है, और अन्य उच्च-स्तरीय व्यवहारों की परिकल्पना करने, अनुमान मॉडल प्रशिक्षण योजनाओं को डिजाइन करने, और मॉडल प्रशिक्षण के दौरान मूल्य व्यापार-नापसंद के नियंत्रण में सुधार करने में अंतर्दृष्टि प्रदान करता है।

Takeaways, Limitations

Takeaways:
एलएलएम के मूल्य-संतुलन तंत्र की समझ को गहरा करें और मनुष्यों से इसके अंतर को उजागर करें।
एलएलएम की तर्क क्षमता और सामाजिक क्षमता के बीच सहसंबंध विश्लेषण के माध्यम से मॉडल विकास के लिए दिशा का सुझाव देना।
एलएलएम प्रशिक्षण के प्रारंभिक चरणों में मूल्य परिवर्तन पैटर्न की पहचान करना ताकि एक कुशल प्रशिक्षण रणनीति स्थापित करने की संभावना का सुझाव दिया जा सके।
विभिन्न एलएलएम आर्किटेक्चर और प्रशिक्षण विधियों के लिए सामान्यीकरण का सुझाव देता है।
Limitations:
विशिष्ट संज्ञानात्मक मॉडलों पर निर्भर होकर एलएलएम के मूल्य संतुलन की व्याख्या करने की अपनी सीमाएं हैं।
विश्लेषण में प्रयुक्त एलएलएम के प्रकार और आकार की सीमाओं के कारण सामान्यीकरण में कठिनाइयाँ।
यह मात्रात्मक रूप से मापना कठिन है कि एलएलएम का मूल्य पैमाना मनुष्यों से कितना मिलता-जुलता है।
इस बात की संभावना है कि यह सामाजिक स्थितियों की जटिलता को पूरी तरह से प्रतिबिंबित न कर सके।
👍