दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

GENUINE: बड़े भाषा मॉडल के लिए ग्राफ़ संवर्धित बहु-स्तरीय अनिश्चितता अनुमान

Created by
  • Haebom

लेखक

टुओ वांग, आदित्य कुलकर्णी, टायलर कोडी, पीटर ए. बेलिंग, युजुन यान, दावेई झोउ

रूपरेखा

यह पत्र बड़े पैमाने के भाषा मॉडल (एलएलएम) की विश्वसनीयता में सुधार के लिए अनिश्चितता अनुमान के महत्व पर जोर देता है और मौजूदा तरीकों में टोकन-स्तरीय संभाव्यता माप के कारण अर्थ संबंधी निर्भरताओं की अनदेखी की समस्या को हल करने के लिए GENUINE (ग्राफ-एन्हांस्ड मल्टी-लेवल अनिश्चितता अनुमान) ढांचे का परिचय देता है। GENUINE निर्भरता पार्स पेड़ों और पदानुक्रमित ग्राफ पूलिंग का उपयोग करके संरचना-जागरूक अनिश्चितता मात्रा का ठहराव करता है, और आत्मविश्वास के आकलन में सुधार के लिए पर्यवेक्षित सीखने के माध्यम से अर्थ और संरचनात्मक संबंधों को प्रभावी ढंग से मॉडल करता है। विभिन्न एनएलपी कार्यों पर प्रायोगिक परिणाम ग्राफ-आधारित अनिश्चितता मॉडलिंग की प्रभावशीलता को प्रदर्शित करते हैं, जो मौजूदा अर्थ संबंधी एन्ट्रॉपी-आधारित दृष्टिकोणों की तुलना में 29% तक अधिक AUROC प्राप्त करते हैं और अंशांकन त्रुटियों को 15% से अधिक कम करते हैं

Takeaways, Limitations

Takeaways:
हम दर्शाते हैं कि ग्राफ-आधारित अनिश्चितता मॉडलिंग एलएलएम की विश्वसनीयता में सुधार कर सकती है।
हमने प्रयोगात्मक रूप से प्रदर्शित किया है कि यह दृष्टिकोण मौजूदा टोकन-दर-टोकन दृष्टिकोण की तुलना में अधिक सटीक और क्षतिपूर्तियुक्त अनिश्चितता अनुमान प्रदान करता है।
अर्थगत और संरचनात्मक संबंधों को ध्यान में रखकर अधिक परिष्कृत अनिश्चितता माप संभव है।
विभिन्न एनएलपी कार्यों के लिए लागू एक सामान्य ढांचा प्रदान करता है।
Limitations:
प्रस्तावित विधि के प्रदर्शन में सुधार विशिष्ट डेटासेट या कार्यों तक सीमित हो सकता है।
कम्प्यूटेशनल लागत पारंपरिक तरीकों की तुलना में अधिक हो सकती है।
परिणाम निर्भरता पार्स वृक्ष की शुद्धता से प्रभावित हो सकते हैं।
विभिन्न प्रकार के एलएलएम के सामान्यीकरण प्रदर्शन पर आगे अनुसंधान की आवश्यकता है।
👍