[공지사항]을 빙자한 안부와 근황 
Show more

दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

एलएलएम सर्वेक्षण प्रतिक्रियाओं में त्वरित विक्षोभ से मानव-सदृश पूर्वाग्रहों का पता चलता है

Created by
  • Haebom

लेखक

जेन्स रुप्प्रेच्ट, जॉर्ज अहनेर्ट, मार्कस स्ट्रोहमेयर

रूपरेखा

यह पत्र सामाजिक विज्ञान सर्वेक्षणों में मानव विषयों के प्रतिनिधि के रूप में बड़े पैमाने पर भाषा मॉडल (एलएलएम) की प्रतिक्रिया पूर्वाग्रह के प्रति विश्वसनीयता और भेद्यता की जांच करता है। विश्व मूल्य सर्वेक्षण (डब्ल्यूवीएस) प्रश्नावली का उपयोग करते हुए, हमने नौ अलग-अलग एलएलएम के साथ 167,000 से अधिक मॉक साक्षात्कार किए, प्रश्न प्रारूप और प्रतिक्रिया विकल्प संरचना में 11 परिवर्तन लागू किए। हम पाते हैं कि एलएलएम न केवल परिवर्तन के लिए असुरक्षित हैं, बल्कि सभी मॉडलों में अलग-अलग शक्तियों के साथ लगातार हालिया पूर्वाग्रह भी प्रदर्शित करते हैं, और प्रस्तुत अंतिम प्रतिक्रिया विकल्प को अधिक पसंद करते हैं। हालांकि बड़े मॉडल आम तौर पर अधिक मजबूत होते हैं, फिर भी सभी मॉडल अर्थ संबंधी परिवर्तनों जैसे कि पुनर्रचना और जटिल परिवर्तनों के प्रति संवेदनशील होते हैं। परिवर्तनों की एक श्रृंखला लागू करने से, हम पाते हैं कि एलएलएम आंशिक रूप से मनुष्यों में देखे गए सर्वेक्षण प्रतिक्रिया पूर्वाग्रहों से मेल खाते हैं

Takeaways, Limitations

Takeaways:
यह दर्शाता है कि सामाजिक विज्ञान सर्वेक्षणों पर लागू होने पर एलएलएम प्रतिक्रिया पूर्वाग्रह के प्रति संवेदनशील है।
एलएलएम में लगातार दिखाई देने वाले नवीनता पूर्वाग्रह की पुष्टि करना।
एलएलएम का उपयोग करके सिंथेटिक सर्वेक्षण डेटा तैयार करते समय त्वरित डिजाइन और मजबूती परीक्षण के महत्व पर जोर दें।
बड़े एलएलएम आकार से आम तौर पर अधिक मजबूती प्राप्त होती है।
हम पुष्टि करते हैं कि एलएलएम की प्रतिक्रिया पूर्वाग्रह आंशिक रूप से मानव प्रतिक्रिया पूर्वाग्रह से मेल खाती है।
Limitations:
इस अध्ययन में प्रयुक्त एलएलएम का प्रकार और डब्ल्यूवीएस प्रश्नों की विशेषताएं अध्ययन परिणामों की सामान्यता को प्रभावित कर सकती हैं।
सर्वेक्षण प्रश्नों और विक्षोभों के अधिक विविध प्रकारों पर आगे अनुसंधान की आवश्यकता है।
एलएलएम में प्रतिक्रिया पूर्वाग्रह को पूरी तरह से समाप्त करने के तरीके को निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।
👍