दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

BERT का उपयोग करके निर्माण पहचान और अस्पष्टता: NPN का एक केस अध्ययन

Created by
  • Haebom

लेखक

वेस्ले सिवेटी, नाथन श्नाइडर

रूपरेखा

इस शोधपत्र में, हम जांच करते हैं कि कैसे BERT, एक ट्रांसफॉर्मर-आधारित भाषा मॉडल, निर्माण व्याकरण के सिद्धांत के आधार पर अंग्रेजी NPN (संज्ञा-पूर्वसर्ग-संज्ञा) वाक्यांशों (जैसे, आमने-सामने, दिन-प्रतिदिन) का प्रतिनिधित्व करता है। NPN वाक्यांश बहुअर्थी विशेषताओं वाले अपेक्षाकृत दुर्लभ वाक्यांश हैं। हम एक अर्थपूर्ण रूप से एनोटेट किए गए कॉर्पस डेटासेट (त्रुटि शब्दों सहित) का निर्माण करते हैं और इसका उपयोग एक जांच करने वाले क्लासिफायर को प्रशिक्षित करने और उसका मूल्यांकन करने के लिए करते हैं जो BERT के प्रतिनिधित्व की खोज करता है। प्रायोगिक परिणाम दिखाते हैं कि BERT एम्बेडिंग में NPN वाक्यांशों के अर्थ का प्रतिनिधित्व करने वाली जानकारी होती है और इसमें सरल सतही वाक्यविन्यास या शाब्दिक संकेतों से परे NPN वाक्यांशों के बारे में निहित ज्ञान होता है। विशेष रूप से, हमने आकृति विज्ञान के प्रति संवेदनशीलता की भी पुष्टि की, जिसके परिणामस्वरूप वे शब्द क्रम को कृत्रिम रूप से बदलने पर NPN वाक्यांशों के रूप में पहचाने जाने में विफल हो जाते हैं।

Takeaways, Limitations

Takeaways:
हम प्रदर्शित करते हैं कि BERT जैसे ट्रांसफॉर्मर मॉडल दुर्लभ और बहुअर्थी वाक्यांशों के लिए अर्थगत और रूपात्मक ज्ञान को स्पष्ट रूप से प्रस्तुत कर सकते हैं।
हम निर्माण व्याकरण सिद्धांत का समर्थन करने वाले साक्ष्य प्रस्तुत करते हैं।
यह BERT के आंतरिक प्रतिनिधित्व और भविष्य के भाषा मॉडल विकास के लिए Takeaways की बेहतर समझ प्रदान करता है।
Limitations:
चूंकि विश्लेषण के लिए लक्ष्य संरचनाएं NPN संरचनाओं तक सीमित हैं, इसलिए सामान्यीकरण पर आगे अनुसंधान की आवश्यकता है।
परिणाम प्रयुक्त डेटासेट के आकार और विविधता से प्रभावित हो सकते हैं।
BERT के आंतरिक तंत्र की पूरी समझ अभी भी अप्राप्य है।
अन्य भाषाओं और अन्य प्रकार के वाक्यविन्यास पर शोध की आवश्यकता है।
👍