यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है। यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है। पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।
GENUINE: बड़े भाषा मॉडल के लिए ग्राफ़ संवर्धित बहु-स्तरीय अनिश्चितता अनुमान
Created by
Haebom
लेखक
टुओ वांग, आदित्य कुलकर्णी, टायलर कोडी, पीटर ए. बेलिंग, युजुन यान, दावेई झोउ
रूपरेखा
यह पत्र बड़े पैमाने के भाषा मॉडल (एलएलएम) की विश्वसनीयता में सुधार के लिए अनिश्चितता अनुमान के महत्व पर जोर देता है और मौजूदा तरीकों में टोकन-स्तरीय संभाव्यता माप के कारण अर्थ संबंधी निर्भरताओं की अनदेखी की समस्या को हल करने के लिए GENUINE (ग्राफ-एन्हांस्ड मल्टी-लेवल अनिश्चितता अनुमान) ढांचे का परिचय देता है। GENUINE निर्भरता पार्स पेड़ों और पदानुक्रमित ग्राफ पूलिंग का उपयोग करके संरचना-जागरूक अनिश्चितता मात्रा का ठहराव करता है, और आत्मविश्वास के आकलन में सुधार के लिए पर्यवेक्षित सीखने के माध्यम से अर्थ और संरचनात्मक संबंधों को प्रभावी ढंग से मॉडल करता है। विभिन्न एनएलपी कार्यों पर प्रायोगिक परिणाम ग्राफ-आधारित अनिश्चितता मॉडलिंग की प्रभावशीलता को प्रदर्शित करते हैं, जो मौजूदा अर्थ संबंधी एन्ट्रॉपी-आधारित दृष्टिकोणों की तुलना में 29% तक अधिक AUROC प्राप्त करते हैं और अंशांकन त्रुटियों को 15% से अधिक कम करते हैं ।
हम दर्शाते हैं कि ग्राफ-आधारित अनिश्चितता मॉडलिंग एलएलएम की विश्वसनीयता में सुधार कर सकती है।
◦
हमने प्रयोगात्मक रूप से प्रदर्शित किया है कि यह दृष्टिकोण मौजूदा टोकन-दर-टोकन दृष्टिकोण की तुलना में अधिक सटीक और क्षतिपूर्तियुक्त अनिश्चितता अनुमान प्रदान करता है।
◦
अर्थगत और संरचनात्मक संबंधों को ध्यान में रखकर अधिक परिष्कृत अनिश्चितता माप संभव है।
◦
विभिन्न एनएलपी कार्यों के लिए लागू एक सामान्य ढांचा प्रदान करता है।
•
Limitations:
◦
प्रस्तावित विधि के प्रदर्शन में सुधार विशिष्ट डेटासेट या कार्यों तक सीमित हो सकता है।
◦
कम्प्यूटेशनल लागत पारंपरिक तरीकों की तुलना में अधिक हो सकती है।
◦
परिणाम निर्भरता पार्स वृक्ष की शुद्धता से प्रभावित हो सकते हैं।
◦
विभिन्न प्रकार के एलएलएम के सामान्यीकरण प्रदर्शन पर आगे अनुसंधान की आवश्यकता है।