दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

स्वचालित साहित्य समीक्षा के लिए बड़े भाषा मॉडल: संदर्भ निर्माण, सार लेखन और समीक्षा रचना का मूल्यांकन

Created by
  • Haebom

लेखक

ज़ुमेई तांग, ज़ुफ़ेंग डुआन, झेंगुआंग जी कै

रूपरेखा

यह शोधपत्र बड़े पैमाने के भाषा मॉडल (एलएलएम) का उपयोग करके साहित्य समीक्षाओं को स्वचालित करने की क्षमता और सीमाओं का अन्वेषण करता है। हालाँकि एलएलएम में दस्तावेज़ संग्रह, संगठन और सारांशीकरण सहित साहित्य समीक्षा प्रक्रिया को स्वचालित करने की क्षमता है, फिर भी व्यापक और विश्वसनीय साहित्य समीक्षाओं को स्वचालित करने में उनकी प्रभावशीलता अभी भी अस्पष्ट है। यह अध्ययन तीन मुख्य कार्यों में एलएलएम के प्रदर्शन का स्वचालित मूल्यांकन करने के लिए एक रूपरेखा प्रस्तुत करता है: संदर्भ उत्पन्न करना, साहित्य का सारांश तैयार करना और साहित्य समीक्षाएँ लिखना। हम उत्पन्न संदर्भों की मतिभ्रम दर का आकलन करते हैं और एक बहुआयामी मूल्यांकन मीट्रिक प्रस्तुत करते हैं जो मानव-जनित संदर्भों की तुलना में सारांशों और लेखन के अर्थगत कवरेज और तथ्यात्मक संगति को मापता है। प्रायोगिक परिणाम दर्शाते हैं कि नवीनतम प्रगति के बावजूद, अत्याधुनिक मॉडल भी मतिभ्रमकारी संदर्भ उत्पन्न करते हैं। इसके अलावा, हम यह भी प्रदर्शित करते हैं कि साहित्य समीक्षा लेखन में विभिन्न मॉडलों का प्रदर्शन विभिन्न विषयों में भिन्न होता है।

Takeaways, Limitations

Takeaways: यह शोधपत्र एलएलएम का उपयोग करके साहित्य समीक्षाओं को स्वचालित करने की क्षमता और सीमाओं का वस्तुनिष्ठ मूल्यांकन करने के लिए एक रूपरेखा और मूल्यांकन मानदंड प्रस्तुत करता है। यह बताते हुए कि एलएलएम का प्रदर्शन विभिन्न शैक्षणिक विषयों में भिन्न होता है, यह शोधपत्र ऐसे मॉडल विकास की आवश्यकता का सुझाव देता है जो क्षेत्र-विशिष्ट विशेषताओं को ध्यान में रखता हो।
Limitations: यहाँ तक कि नवीनतम एलएलएम ने भी भ्रमात्मक संदर्भ उत्पन्न करने में समस्याओं की पहचान की है। इससे एलएलएम का उपयोग करके स्वचालित साहित्य समीक्षा की विश्वसनीयता में सुधार के लिए और अधिक शोध और विकास की आवश्यकता का संकेत मिलता है। प्रस्तावित ढाँचे और मूल्यांकन मानकों की सामान्यता निर्धारित करने के लिए और अधिक शोध की आवश्यकता है।
👍