दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

ध्यान विश्लेषण के माध्यम से सारणीबद्ध प्रश्नोत्तर के लिए भाषा मॉडल की मजबूती की खोज

Created by
  • Haebom

लेखक

कुशल राज भंडारी, सिक्स्यू जिंग, सोहम डैन, जियानक्सी गाओ

रूपरेखा

यह पत्र इस खोज पर आधारित है कि बड़े पैमाने पर भाषा मॉडल (एलएलएम), जिन्होंने विभिन्न असंरचित पाठ समझ कार्यों पर उत्कृष्ट प्रदर्शन का प्रदर्शन किया है, विशेष प्रशिक्षण के बिना सारणीबद्ध (संरचित) समझ कार्यों को भी कर सकते हैं। हमने विभिन्न संवर्द्धन और गड़बड़ी के तहत विकिपीडिया-आधारित डब्ल्यूटीक्यू, वित्तीय टीएटी-क्यूए और वैज्ञानिक एससीआईटीएबी सहित विभिन्न डोमेन पर एलएलएम का परीक्षण किया। हमने सारणीबद्ध प्रश्न उत्तर (टीक्यूए) की मजबूती पर संदर्भ-आधारित सीखने (आईसीएल), मॉडल आकार, निर्देशात्मक ट्यूनिंग और डोमेन पूर्वाग्रह के प्रभावों की जांच की। जबकि निर्देशात्मक ट्यूनिंग और बड़े, अधिक आधुनिक एलएलएम मजबूत और अधिक मजबूत टीक्यूए प्रदर्शन देते हैं, डेटा संदूषण और विश्वसनीयता के मुद्दे बने हुए हैं, विशेष रूप से डब्ल्यूटीक्यू में। यह सारणीबद्ध डेटा के लिए एलएलएम की पारदर्शिता, सामान्यीकरण और वास्तविक दुनिया की विश्वसनीयता में सुधार करने के लिए संरचना-जागरूक आत्म-ध्यान तंत्र और डोमेन-अनुकूली प्रसंस्करण तकनीकों को विकसित करने की आवश्यकता पर प्रकाश डालता है।

Takeaways, Limitations

Takeaways:
निर्देशात्मक ट्यूनिंग और बड़े, अधिक हाल के एलएलएम बेहतर सारणीबद्ध प्रश्न उत्तर (टीक्यूए) प्रदर्शन और बढ़ी हुई मजबूती में योगदान करते हैं।
हमने गड़बड़ी और प्रदर्शन में गिरावट के कारण ध्यान वितरण में परिवर्तन के बीच एक मजबूत सहसंबंध प्रकट किया है, जिसमें मॉडल की मध्यवर्ती परतों में सबसे अधिक संवेदनशीलता होती है।
संरचना-जागरूक आत्म-ध्यान तंत्र और डोमेन-अनुकूली प्रसंस्करण तकनीकों को विकसित करने की आवश्यकता प्रस्तुत की गई है।
Limitations:
WTQ सहित कुछ डेटासेटों में डेटा संदूषण और विश्वसनीयता संबंधी समस्याएं अभी भी मौजूद हैं।
अधिक उन्नत व्याख्या योग्य पद्धतियों के माध्यम से एलएलएम की विश्वसनीयता में सुधार की आवश्यकता जताई गई है।
👍