दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

एलएलएम में व्यक्तित्व प्रतिनिधित्व का स्थानीयकरण

Created by
  • Haebom

लेखक

सेलिया सिंटास, मिरियम रेटिके, एरिक मिहलिंग, एलिजाबेथ डेली, स्काइलर स्पीकमैन

रूपरेखा

यह शोधपत्र इस बात का अध्ययन प्रस्तुत करता है कि कैसे और कहाँ व्यक्तित्व, जिन्हें विशिष्ट मानवीय लक्षणों, मूल्यों और विश्वासों के समूह के रूप में परिभाषित किया जाता है, वृहत्-स्तरीय भाषा मॉडलों (एलएलएम) के निरूपण स्थान में कूटबद्ध होते हैं। विभिन्न आयाम न्यूनीकरण और प्रतिरूप पहचान विधियों का उपयोग करते हुए, हम सबसे पहले उन मॉडल परतों की पहचान करते हैं जो इन निरूपणों के कूटलेखन में सबसे अधिक भिन्नता प्रदर्शित करती हैं। फिर हम इन चयनित परतों के भीतर सक्रियणों का विश्लेषण करते हैं ताकि यह जाँचा जा सके कि विशिष्ट व्यक्तित्व, साझा और स्वतंत्र एम्बेडिंग स्थानों सहित, अन्य व्यक्तित्वों के सापेक्ष कैसे कूटबद्ध होते हैं। हम पाते हैं कि कई पूर्व-प्रशिक्षित डिकोडर-ओनली एलएलएम में विश्लेषित व्यक्तित्व, केवल डिकोडर परत के अंतिम एक तिहाई भाग में निरूपण स्थान में महत्वपूर्ण अंतर प्रदर्शित करते हैं। नैतिक शून्यवाद और उपयोगितावाद जैसे विशिष्ट नैतिक दृष्टिकोणों के लिए अतिव्यापी सक्रियण देखे जाते हैं, जो अस्पष्टता का संकेत देते हैं। इसके विपरीत, रूढ़िवाद और उदारवाद जैसी राजनीतिक विचारधाराएँ, अधिक विशिष्ट क्षेत्रों में निरूपित होती प्रतीत होती हैं। ये निष्कर्ष इस बारे में हमारी समझ को बढ़ाते हैं कि एलएलएम आंतरिक रूप से सूचना का प्रतिनिधित्व कैसे करते हैं और एलएलएम आउटपुट में विशिष्ट मानवीय लक्षणों के मॉड्यूलेशन को बेहतर बनाने के भविष्य के प्रयासों को सूचित कर सकते हैं। सावधानी: इस पेपर में संभावित रूप से आपत्तिजनक नमूना वाक्य शामिल हैं।

Takeaways, Limitations

Takeaways:
एलएलएम किस प्रकार व्यक्तित्व को एनकोड करता है, इसकी समझ में वृद्धि हुई।
Takeaways विशिष्ट मानवीय विशेषताओं के मॉड्यूलेशन में सुधार के लिए एलएलएम विकास प्रदान करता है।
एलएलएम के भीतर नैतिक दृष्टिकोण और राजनीतिक विचारधाराओं को व्यक्त करने के तरीके में अंतर प्रस्तुत करना।
यह खोज कि डिकोडर परत का अंतिम तीसरा भाग व्यक्तित्व निरूपण में महत्वपूर्ण भूमिका निभाता है।
Limitations:
विश्लेषण में प्रयुक्त कुछ नमूना वाक्य संभवतः आपत्तिजनक हो सकते हैं।
विश्लेषण किए जाने वाले एलएलएम के प्रकार और दायरे पर स्पष्टता का अभाव (आगे अनुसंधान की आवश्यकता हो सकती है)।
विभिन्न व्यक्तित्व प्रकारों का व्यापक विश्लेषण उपलब्ध नहीं हो सकता है (इसके लिए और अधिक शोध की आवश्यकता हो सकती है)।
व्यक्तित्व एन्कोडिंग के अधिक गहन यांत्रिक विश्लेषण की आवश्यकता हो सकती है।
👍