दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

KROMA: ज्ञान पुनर्प्राप्ति और बड़े भाषा मॉडल के साथ ऑन्टोलॉजी मिलान

Created by
  • Haebom

लेखक

लैम गुयेन, एरिका बार्सिलोस, रोजर फ्रेंच, यिंगहुई वू

रूपरेखा

KROMA एक नवीन ऑन्टोलॉजी मिलान (OM) ढाँचा है जो बड़े पैमाने के भाषा मॉडल (LLM) का लाभ उठाकर OM कार्यों के अर्थगत संदर्भ को गतिशील रूप से समृद्ध करता है। मौजूदा प्रणालियों की सीमित अनुकूलन क्षमता को संबोधित करने के लिए, यह संरचनात्मक, शाब्दिक और परिभाषात्मक ज्ञान का लाभ उठाते हुए, पुनर्प्राप्ति संवर्धित पीढ़ी (RAG) पाइपलाइन के भीतर LLM का लाभ उठाता है। प्रदर्शन और दक्षता दोनों को अनुकूलित करने के लिए, यह संभावित अवधारणाओं को समाप्त करने और LLM आह्वानों से जुड़े संचार ओवरहेड को उल्लेखनीय रूप से कम करने के लिए समानता-आधारित अवधारणा मिलान और हल्के ऑन्टोलॉजी परिशोधन चरणों को एकीकृत करता है। कई बेंचमार्क डेटासेट पर किए गए प्रयोगों से पता चलता है कि संदर्भ-समृद्ध LLM को ज्ञान पुनर्प्राप्ति के साथ एकीकृत करने से मौजूदा OM प्रणालियों और अत्याधुनिक LLM-आधारित दृष्टिकोणों की तुलना में बेहतर प्रदर्शन होता है, जबकि तुलनीय संचार ओवरहेड बना रहता है। यह अध्ययन बड़े पैमाने पर ऑन्टोलॉजी मिलान के लिए प्रस्तावित अनुकूलन तकनीकों (लक्षित ज्ञान पुनर्प्राप्ति, शीघ्र संवर्धन और ऑन्टोलॉजी परिशोधन) की व्यवहार्यता और लाभों पर प्रकाश डालता है।

Takeaways, Limitations

Takeaways:
हम प्रदर्शित करते हैं कि एलएलएम और आरएजी पाइपलाइनों को संयोजित करने से ऑन्टोलॉजी मिलान के प्रदर्शन और दक्षता में काफी सुधार हो सकता है।
हम लक्ष्य ज्ञान पुनर्प्राप्ति, शीघ्र संवर्धन और ऑन्टोलॉजी सुधार जैसी अनुकूलन तकनीकों की प्रभावशीलता को अनुभवजन्य रूप से प्रदर्शित करते हैं।
यह ऐसा प्रदर्शन प्राप्त करता है जो मौजूदा ओएम प्रणालियों और अत्याधुनिक एलएलएम-आधारित दृष्टिकोणों से बेहतर है।
हम बड़े पैमाने पर ऑन्टोलॉजी मिलान समस्या का एक व्यावहारिक समाधान प्रस्तुत करते हैं।
Limitations:
यह विशिष्ट एलएलएम पर निर्भर हो सकता है और परिणाम एलएलएम के प्रदर्शन से प्रभावित हो सकते हैं।
प्रयुक्त बेंचमार्क डेटासेट की सीमाओं के कारण, सामान्यीकरण पर और अधिक शोध की आवश्यकता है।
हल्के ऑन्टोलॉजी सुधार चरण के लिए अनुकूलन पैरामीटर निर्धारित करने पर आगे अनुसंधान की आवश्यकता हो सकती है।
विभिन्न प्रकार के ऑन्टोलॉजी पर प्रयोज्यता और सामान्यीकरण पर आगे अनुसंधान की आवश्यकता है।
👍