दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

ऑटोस्कीमाकेजी: वेब-स्केल कॉर्पोरा से गतिशील स्कीमा प्रेरण के माध्यम से स्वायत्त ज्ञान ग्राफ निर्माण

Created by
  • Haebom

लेखक

जियाक्सिन बाई, वेई फैन, क्यूई हू, किंग जोंग, चुनयांग ली, होंग टिंग त्सांग, होंगयु लुओ, याउवाई यिम, हाओयू हुआंग, जिओ झोउ, फेंग किन, तियान्शी झेंग, शी पेंग, शिन याओ, हुइवेन यांग, लीजी वू, यी जी, गोंग झांग, रेनहाई चेन, यांगकिउ सॉन्ग

रूपरेखा

AutoSchemaKG बिना किसी पूर्वनिर्धारित स्कीमा के पूर्णतः स्वायत्त ज्ञान ग्राफ निर्माण हेतु एक ढाँचा है। यह पाठ से ज्ञान त्रिगुण निकालने और साथ ही एक व्यापक स्कीमा उत्पन्न करने के लिए बड़े पैमाने के भाषा मॉडल का लाभ उठाता है, संस्थाओं और घटनाओं दोनों का मॉडलिंग करता है और संकल्पना के माध्यम से उदाहरणों को अर्थ श्रेणियों में व्यवस्थित करता है। 5 करोड़ से अधिक दस्तावेज़ों को संसाधित करके, हमने 90 करोड़ से अधिक नोड्स और 5.9 अरब किनारों वाला एक ज्ञान ग्राफ, ATLAS (स्वचालित त्रिगुण लिंकिंग और स्कीमा प्रेरण) तैयार किया। यह दृष्टिकोण बहु-चरणीय प्रश्नोत्तर कार्यों में अत्याधुनिक मानकों से बेहतर प्रदर्शन करता है और LLM की यथार्थवादिता को बढ़ाता है। विशेष रूप से, स्कीमा प्रेरण, बिना किसी मानवीय हस्तक्षेप के मानव-जनित स्कीमा के साथ 92% अर्थ संरेखण प्राप्त करता है, यह दर्शाता है कि गतिशील रूप से प्रेरित स्कीमा वाला एक अरब-इकाई ज्ञान ग्राफ, बड़े पैमाने के भाषा मॉडल के पैरामीट्रिक ज्ञान का प्रभावी ढंग से पूरक हो सकता है।

Takeaways, Limitations

Takeaways:
हम पूर्वनिर्धारित स्कीमा के बिना पूर्णतः स्वायत्त रूप से ज्ञान ग्राफ निर्माण के लिए एक नवीन रूपरेखा प्रस्तुत करते हैं।
बड़े पैमाने पर भाषा मॉडल का उपयोग करके एक साथ ज्ञान त्रिगुण निष्कर्षण और स्कीमा व्युत्पत्ति।
बहु-चरणीय प्रश्न-उत्तर निष्पादन में सुधार लाने तथा LLM की सत्यता को बढ़ाने के लिए एक अरब-इकाई-स्तरीय ज्ञान ग्राफ, ATLAS का निर्माण करना।
स्वचालित रूप से व्युत्पन्न स्कीमा मानव-जनित स्कीमा के साथ उच्च अर्थगत संरेखण (92%) प्राप्त करते हैं।
हम बड़े पैमाने के भाषा मॉडल के पैरामीट्रिक ज्ञान को प्रभावी ढंग से पूरक करने के लिए गतिशील रूप से व्युत्पन्न स्कीमा के साथ ज्ञान ग्राफ की क्षमता प्रस्तुत करते हैं।
Limitations:
पेपर में Limitations का स्पष्ट रूप से उल्लेख नहीं किया गया है। स्कीमा व्युत्पत्ति की सटीकता में सुधार और विभिन्न डेटा प्रकारों पर इसकी प्रयोज्यता को सत्यापित करने के लिए आगे शोध की आवश्यकता हो सकती है। इसके अलावा, उत्पन्न ज्ञान ग्राफ की पूर्णता और विश्वसनीयता का और मूल्यांकन आवश्यक हो सकता है।
👍