दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

क्या बड़े भाषा मॉडल मानवीय प्रतिक्रियाओं का अनुकरण कर सकते हैं? तापन-संबंधी विकल्पों के संदर्भ में घोषित वरीयता प्रयोगों का एक केस स्टडी

Created by
  • Haebom

लेखक

हान वांग, जेसेक पावलक, अरुणा शिवकुमार

रूपरेखा

यह अध्ययन इस बात की जांच करता है कि ऊर्जा से संबंधित विकल्प प्रयोग सर्वेक्षणों में उपभोक्ता विकल्पों का अनुकरण करने और उन्हें डेटा विश्लेषण वर्कफ़्लो में एकीकृत करने के लिए बड़े पैमाने पर भाषा मॉडल (एलएलएम) का उपयोग कैसे किया जाए। LLaMA 3.1, मिस्ट्रल, GPT-3.5 और डीपसीक-आर1 सहित कई एलएलएम का उपयोग करते हुए, हमने परीक्षण परिदृश्यों की एक श्रृंखला तैयार की और त्वरित डिजाइन, संदर्भ-आधारित शिक्षण (ICL), विचार-श्रृंखला (CoT) अनुमान, एलएलएम प्रकार, मौजूदा विकल्प मॉडल के साथ एकीकरण और संभावित पूर्वाग्रहों को ध्यान में रखते हुए व्यक्तिगत और समग्र दोनों स्तरों पर सिमुलेशन प्रदर्शन का व्यवस्थित रूप से मूल्यांकन किया। क्लाउड-आधारित एलएलएम ने हमेशा छोटे, स्थानीय मॉडलों से बेहतर प्रदर्शन नहीं किया; अनुमानात्मक मॉडल, डीपसीक-आर1 ने उच्चतम औसत सटीकता (77%) हासिल की हमने पाया कि पूर्व चयनित डेटा सबसे प्रभावी इनपुट था, तथा अतिरिक्त तत्वों और भिन्न प्रारूपों वाले लंबे संकेत LLM को विचलित कर सकते थे और सटीकता को कम कर सकते थे।

Takeaways, Limitations

Takeaways:
एलएलएम का उपयोग करके ऊर्जा-संबंधी विकल्प प्रयोग सर्वेक्षणों को कुशलतापूर्वक संचालित करने की संभावना का सुझाव देना।
हम दर्शाते हैं कि डीपसीक-आर1 जैसे अनुमान मॉडल चयन प्रयोगों के अनुकरण में प्रभावी हैं।
एलएलएम का उपयोग करके सर्वेक्षणों में संभावित पूर्वाग्रहों की पहचान करना और उन्हें दूर करने के तरीके सुझाना।
हम एलएलएम प्रदर्शन पर त्वरित डिजाइन और अतिरिक्त सूचना प्रावधान विधियों के प्रभाव का विश्लेषण करते हैं और इष्टतम डिजाइन विधियों का सुझाव देते हैं।
Limitations:
अनुसंधान में प्रयुक्त एलएलएम का प्रकार और आकार सीमित हो सकता है।
वास्तविक सर्वेक्षण प्रतिभागियों और एलएलएम के उत्तरों के बीच अंतर निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।
एलएलएम द्वारा सिमुलेशन परिणामों की सामान्यीकरणता के आगे सत्यापन की आवश्यकता है।
कुछ ऊर्जा प्रौद्योगिकियों और नीतियों के प्रति पूर्वाग्रह हो सकते हैं।
👍