[공지사항]을 빙자한 안부와 근황 
Show more

दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

शैक्षिक पाठ्यपुस्तक प्रश्नोत्तर पर बहुविधीय वृहद भाषा मॉडल का मूल्यांकन

Created by
  • Haebom

लेखक

हेस्सा ए अलाव्वाद, अनस जफर, अरीज अलहोथली, उस्मान नसीम, अली अलखथलन, अमानी जमाल

रूपरेखा

यह पेपर CK12-QA डेटासेट पर अत्याधुनिक मल्टीमॉडल लार्ज-स्केल लैंग्वेज मॉडल (MLLM), LLaVA-1.5 और LLaMA 3.2-Vision की पाठ्यपुस्तक प्रश्न उत्तर (TQA) क्षमताओं का मूल्यांकन करने वाला पहला पेपर है। वास्तविक दुनिया के शिक्षण वातावरण का अनुकरण करने के लिए, हम एक मल्टीमॉडल रिट्रीवल ऑगमेंटेड जेनरेशन (RAG) पाइपलाइन पेश करते हैं जो प्रासंगिक पाठ्यपुस्तक पैराग्राफ और चित्रों को संदर्भ के रूप में प्रदान करता है। ज़ीरो-शॉट प्रयोगों से पता चलता है कि पुनर्प्राप्त संदर्भ LLaVA के पाठ-आधारित प्रश्न प्रदर्शन में सुधार करता है, जबकि यह LLaMA 3.2-Vision की चित्र-आधारित प्रश्न सटीकता को 74.07% से 25.93% तक महत्वपूर्ण रूप से कम कर देता है, एक घटना जिसे "भयावह संदर्भ हस्तक्षेप" के रूप में जाना जाता है।

Takeaways, Limitations

Takeaways:
एमएलएलएम की पाठ्यपुस्तक प्रश्न-उत्तर कौशल का पहला मूल्यांकन प्रदान करता है।
हम प्रदर्शित करते हैं कि एक बहु-मॉडल RAG पाइपलाइन वास्तविक दुनिया के शिक्षण वातावरण का प्रभावी ढंग से अनुकरण कर सकती है।
हम एमएलएलएम में "घातक प्रासंगिक हस्तक्षेप" नामक एक घटना पाते हैं, जो मॉडल प्राथमिकता सेटिंग और प्रासंगिक एकीकरण के महत्व पर जोर देती है।
हम एमएलएलएम की वास्तुकला के अनुसार प्रदर्शन अंतर दिखाते हैं और भविष्य के अनुसंधान दिशाओं का सुझाव देते हैं।
एआई-आधारित शैक्षिक उपकरण विकसित करने के लिए एक बेंचमार्क प्रदान करता है।
Limitations:
सामान्यीकरण की जांच के लिए केवल एक CK12-QA डेटासेट का उपयोग करना अपर्याप्त हो सकता है।
मूल्यांकन में प्रयुक्त एम.एल.एल.एम. सीमित हो सकता है।
“घातक प्रासंगिक हस्तक्षेप” घटना के कारणों के गहन विश्लेषण का अभाव है।
👍