दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

अर्थ-सम्पन्न व्याकरण: ढाल स्वीकार्यता, LLM में निर्माणों के ज्यामितीय निरूपण को आकार देती है

Created by
  • Haebom

लेखक

सुपंथो रक्षित, एडेल गोल्डबर्ग

रूपरेखा

यह अध्ययन, उपयोग-आधारित रचनावाद (UCx) दृष्टिकोण पर आधारित है, यह जांच करता है कि क्या बड़े पैमाने के भाषा मॉडल (LLM) के आंतरिक प्रतिनिधित्व सुविधा-समृद्ध, पदानुक्रमित संरचनाओं को दर्शाते हैं। पायथिया-1.4B मॉडल का उपयोग करते हुए, हम अंग्रेजी डबल-ऑब्जेक्ट (DO) और प्रीपोजिशन-ऑब्जेक्ट (PO) वाक्यांशों के प्रतिनिधित्व का विश्लेषण करते हैं। हम 5,000 वाक्य जोड़े के डेटासेट का लाभ उठाते हैं जिसमें DO या PO के लिए मानव-मूल्यांकित वरीयता व्यवस्थित रूप से भिन्न थी। ज्यामितीय विश्लेषण से पता चलता है कि दो वाक्यांश प्रतिनिधित्वों की पृथक्करणता, जैसा कि ऊर्जा दूरी या जेन्सन-शैनन विचलन द्वारा मापा जाता है, को व्यवस्थित रूप से ढाल वरीयता शक्ति द्वारा संशोधित किया जाता है। यही है, प्रत्येक वाक्यांश के अधिक विशिष्ट उदाहरण सक्रियण स्थान में अधिक विशिष्ट क्षेत्रों पर कब्जा करते हैं

Takeaways, Limitations

Takeaways:
हम साक्ष्य प्रस्तुत करते हैं कि एलएलएम पदानुक्रमित वाक्यविन्यास निरूपण सीखता है, जिसमें उपयोग-आधारित रचनावाद (यूसीएक्स) द्वारा सुझाई गई विशेषताएं शामिल होती हैं।
हम एलएलएम के आंतरिक प्रतिनिधित्व के विश्लेषण के लिए ज्यामितीय माप विधियों को लागू करने की उपयोगिता को प्रदर्शित करते हैं।
एलएलएम वाक्यविन्यास की समझ में नई अंतर्दृष्टि प्रदान करता है।
Limitations:
यह निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है कि क्या विश्लेषण में प्रयुक्त एलएलएम (पाइथिया-1.4बी) के पैमाने और संरचनात्मक विशेषताओं को अन्य एलएलएम में सामान्यीकृत किया जा सकता है।
मानव वरीयता आकलन में व्यक्तिपरकता परिणामों को प्रभावित कर सकती है।
क्योंकि विश्लेषण लक्ष्य वाक्य अंग्रेजी डीओ और पीओ वाक्यों तक सीमित हैं, अन्य भाषाओं या वाक्य प्रकारों के लिए सामान्यीकरण की आवश्यकता है।
👍