दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

स्ट्रक्चरसेंस: मानव-इन-द-लूप मूल्यांकन और बेंचमार्किंग के साथ संरचित सूचना निष्कर्षण के लिए एक कार्य-अज्ञेय एजेंटिक ढांचा

Created by
  • Haebom

लेखक

टेक राज छेत्री, यिबेई चेन, पूजा त्रिवेदी, डोरोटा जारेका, सैफ हाओब्श, पैट्रिक रे, लिडिया एनजी, सत्रजीत एस. घोष

रूपरेखा

इस शोधपत्र का उद्देश्य वैज्ञानिक खोज और ज्ञान एकीकरण को बढ़ाने के लिए असंरचित डेटा (जैसे, मुक्त-पाठ दस्तावेज़, वैज्ञानिक साहित्य) से संरचित जानकारी के निष्कर्षण में तेज़ी लाना है। हालाँकि बड़े पैमाने के भाषा मॉडल (एलएलएम) ने विभिन्न प्राकृतिक भाषा प्रसंस्करण कार्यों में उत्कृष्ट प्रदर्शन प्रदर्शित किया है, लेकिन वे कुछ ऐसे क्षेत्रों में कम कुशल हैं जहाँ विशिष्ट ज्ञान और सूक्ष्म समझ की आवश्यकता होती है, और कार्यों और क्षेत्रों के बीच हस्तांतरणीयता की कमी से ग्रस्त हैं। इन चुनौतियों का समाधान करने के लिए, हम StructSense प्रस्तुत करते हैं, जो एक मॉड्यूलर, कार्य-स्वतंत्र, ओपन-सोर्स ढाँचा है जो जटिल डोमेन सामग्री का अधिक प्रभावी ढंग से अन्वेषण करने के लिए ऑन्टोलॉजी में अंतर्निहित डोमेन-विशिष्ट प्रतीकात्मक ज्ञान का लाभ उठाता है। StructSense स्व-मूल्यांकन निर्णायकों के माध्यम से पुनरावृत्त सुधार के लिए एक फीडबैक लूप और गुणवत्ता आश्वासन एवं सत्यापन के लिए एक मानवीय हस्तक्षेप तंत्र को एकीकृत करता है। एक तंत्रिका विज्ञान सूचना निष्कर्षण कार्य में अनुप्रयोग के माध्यम से, हम प्रदर्शित करते हैं कि StructSense दो सीमाओं पर विजय प्राप्त करता है: डोमेन संवेदनशीलता और क्रॉस-टास्क सामान्यीकरण का अभाव।

Takeaways, Limitations

Takeaways:
एलएलएम-आधारित संरचित सूचना निष्कर्षण में डोमेन संवेदनशीलता और क्रॉस-टास्क हस्तांतरणीयता के मुद्दों को संबोधित करने के लिए एक नया दृष्टिकोण।
एलएलएम के प्रदर्शन को बढ़ाना तथा ऑन्टोलॉजी-आधारित ज्ञान के उपयोग के माध्यम से विशिष्ट क्षेत्रों में इसकी प्रयोज्यता का विस्तार करना।
स्व-मूल्यांकन और मानवीय हस्तक्षेप तंत्र के माध्यम से गुणवत्ता नियंत्रण और विश्वसनीयता में सुधार करना।
मॉड्यूलर, कार्य-स्वतंत्र, ओपन-सोर्स फ्रेमवर्क प्रदान करके अनुसंधान और विकास दक्षता में वृद्धि।
Limitations:
प्रस्तावित ढांचे की अन्य डोमेन और कार्यों के लिए सामान्यीकरण क्षमता निर्धारित करने के लिए आगे सत्यापन की आवश्यकता है।
ऑन्टोलॉजी के विकास और प्रबंधन की कठिनाई और लागत।
पूर्ण स्वचालन कठिन हो सकता है क्योंकि इसमें कुछ भाग ऐसे होते हैं जिनमें मानवीय हस्तक्षेप की आवश्यकता होती है।
विशिष्ट डोमेन के प्रति पक्षपाती ऑन्टोलॉजी के उपयोग के कारण सामान्यीकरण प्रदर्शन में संभावित गिरावट।
👍