दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

बहुविधीय वृहद भाषा मॉडलों के लिए अनुकूली रूप से अनुमान लगाना सीखना

Created by
  • Haebom

लेखक

झुओयान जू, खोई डुक गुयेन, प्रीति मुखर्जी, सौरभ बागची, सोमाली चटर्जी, यिंगयु लियांग, यिन ली

रूपरेखा

यह शोधपत्र AdaLLaVA का प्रस्ताव करता है, जो बहुविधीय वृहद-स्तरीय भाषा मॉडल (MLLM) के कुशल अनुमान हेतु एक अनुकूली अनुमान ढाँचा है। पारंपरिक MLLM अपनी उच्च गणना लागत के कारण संसाधन-सीमित परिवेशों में परिनियोजित करने में कठिनाई का अनुभव करते हैं। AdaLLaVA एक शिक्षण-आधारित दृष्टिकोण के माध्यम से इस चुनौती का समाधान करता है जो अनुमान के दौरान MLLM गणनाओं को गतिशील रूप से पुनर्संयोजित करता है, जिसमें इनपुट डेटा और विलंबता बजट को ध्यान में रखा जाता है। प्रश्नोत्तर, अनुमान और मतिभ्रम सहित विभिन्न मानक प्रयोगों के माध्यम से, हम प्रदर्शित करते हैं कि AdaLLaVA इनपुट विलंबता बजट को प्रभावी ढंग से पूरा करता है और निष्पादन समय के आधार पर सटीकता और विलंबता के बीच विभिन्न समझौतों को प्राप्त करता है। इसके अलावा, हम प्रदर्शित करते हैं कि AdaLLaVA इनपुट विलंबता और विषय-वस्तु के अनुकूल होता है, दक्षता बढ़ाने के लिए टोकन चयन के साथ एकीकृत होता है, और विभिन्न MLLM के लिए सामान्यीकृत होता है।

Takeaways, Limitations

Takeaways:
संसाधन-सीमित वातावरण में भी एमएलएलएम का कुशलतापूर्वक उपयोग करने के लिए एक नई विधि प्रस्तुत करना।
इनपुट डेटा और विलंबता बजट के आधार पर MLLM परिचालनों को गतिशील रूप से समायोजित करके इष्टतम प्रदर्शन प्राप्त करें।
टोकन चयन के साथ एकीकरण से आगे की दक्षता लाभ की संभावना उत्पन्न होती है।
विभिन्न एम.एल.एल.एम. पर लागू एक सामान्य रूपरेखा।
Limitations:
AdaLLaVA का प्रदर्शन प्रयुक्त MLLM और बेंचमार्क डेटासेट के आधार पर भिन्न हो सकता है।
वास्तविक दुनिया के वातावरण में सामान्यीकरण प्रदर्शन के आगे सत्यापन की आवश्यकता है।
बहुत जटिल प्रश्नों या छवियों के प्रसंस्करण प्रदर्शन के लिए और अधिक शोध की आवश्यकता हो सकती है।
👍