दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

व्यावहारिक अनुमान श्रृंखला (पीआईसी) एलएलएम के प्रामाणिक निहित विषाक्त भाषा के तर्क में सुधार

Created by
  • Haebom

लेखक

शी चेन, शुओ वांग

रूपरेखा

यह शोधपत्र बड़े पैमाने के भाषा मॉडलों (एलएलएम) की नैतिक चुनौतियों का समाधान करता है और विषाक्त भाषा पहचान तकनीकों के विकास की नई संभावनाओं को उजागर करता है। जबकि पिछले अध्ययनों में सरल अर्थ-संबंधी संबंधों (जैसे, "वह" और "प्रोग्रामर" तथा "वह" और "गृहिणी" के बीच पक्षपाती संबंध) पर आधारित आँकड़ों का उपयोग किया गया है, यह अध्ययन वास्तविक दुनिया के विषाक्त अंतःक्रिया आँकड़ों को एकत्र करता है, जो ऑनलाइन सेंसरशिप से बचते हैं और मानव मूल्यांकनकर्ताओं द्वारा अनुमान की आवश्यकता वाले के रूप में पहचाने गए हैं। इस आँकड़ों के आधार पर, हम संज्ञानात्मक विज्ञान और भाषाविज्ञान में अनुसंधान का लाभ उठाते हुए एक नवीन संकेत विधि, व्यावहारिक अनुमान श्रृंखला (PIC) का प्रस्ताव करते हैं। हम प्रदर्शित करते हैं कि PIC संकेत, GPT-4o, Llama-3.1-70B-Instruct, DeepSeek-v2.5, और DeepSeek-v3 जैसे मॉडलों में, मौजूदा संकेत विधियों (जैसे, CoT, नियम-आधारित) की तुलना में अंतर्निहित विषाक्त भाषा की पहचान करने की सफलता दर में उल्लेखनीय सुधार करता है, और अधिक स्पष्ट एवं अधिक सुसंगत अनुमान प्रक्रियाएँ उत्पन्न करता है। इससे पता चलता है कि हमारी पद्धति को अन्य अनुमान-गहन कार्यों, जैसे हास्य और रूपक समझ, के लिए भी सामान्यीकृत किया जा सकता है।

Takeaways, Limitations

Takeaways:
एक नवीन प्रॉम्प्टिंग विधि (पीआईसी) प्रस्तुत की गई है जो विचारोत्तेजक और परिष्कृत विषाक्त भाषा का पता लगाने में प्रभावी है।
एलएलएम की अनुमान क्षमताओं को बढ़ाकर विषाक्त भाषा पहचान प्रदर्शन में सुधार करना।
अन्य अनुमान-गहन कार्यों (जैसे, हास्य, रूपक समझ) के लिए PIC संकेत की सामान्यता का सुझाव देना
वास्तविक दुनिया के ऑनलाइन वातावरण में विषाक्त अंतःक्रियाओं के डेटासेट का निर्माण और उपयोग
Limitations:
प्रस्तावित पीआईसी प्रॉम्प्टिंग की सामान्यता को आगे के शोध के माध्यम से सत्यापित किया जाना चाहिए।
उपयोग किये गये डेटासेट के दायरे और प्रतिनिधित्व के संबंध में आगे चर्चा की आवश्यकता है।
विभिन्न एलएलएम मॉडलों के लिए पीआईसी प्रॉम्प्टिंग के प्रदर्शन का अधिक गहन तुलनात्मक विश्लेषण आवश्यक है।
👍