[공지사항]을 빙자한 안부와 근황 
Show more

दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

फाउंडेशन मॉडल की (लगभग) निःशुल्क मोडैलिटी सिलाई

Created by
  • Haebom

लेखक

जयसिद्ध सिंह, दिगंता मिश्रा, बोरिस कनीज़ेव, एंटोनियो ऑर्विएटो

रूपरेखा

यह शोधपत्र विभिन्न पूर्व-प्रशिक्षित एकल-मोडल मॉडलों को जोड़कर एक बहु-मोडल मॉडल बनाने की मौजूदा विधि की सीमाओं को इंगित करता है, और इस समस्या के समाधान के लिए एक नई विधि, हाइपरनेटवर्क मॉडल अलाइनमेंट (Hyma) प्रस्तावित करता है। जहाँ मौजूदा विधि में एकल-मोडल मॉडल चुनने और कनेक्शन मॉड्यूल को प्रशिक्षित करने के लिए बहुत अधिक कम्प्यूटेशनल लागत की आवश्यकता होती है, वहीं Hyma हाइपरनेटवर्क का उपयोग करके एकल-मोडल मॉडलों और कनेक्शन मॉड्यूल के इष्टतम संयोजन को एक साथ सीखकर दक्षता में सुधार करता है। Hyma एकल-मोडल मॉडलों के N x M संयोजनों के लिए कनेक्शन मॉड्यूल को संयुक्त रूप से सीखता है, जिससे इष्टतम मॉडल संयोजन की खोज की लागत में भारी कमी आती है।

Takeaways, Limitations

Takeaways:
हम यह प्रदर्शित करते हैं कि हाइपरनेटवर्क का उपयोग बहु-मॉडल मॉडल के निर्माण की कम्प्यूटेशनल लागत को नाटकीय रूप से कम करने के लिए किया जा सकता है।
हम इष्टतम एकल-मोड मॉडल संयोजन को कुशलतापूर्वक खोजने के लिए एक नवीन विधि प्रस्तुत करते हैं।
विभिन्न मल्टी-मोडल बेंचमार्क पर ग्रिड खोज जैसा प्रदर्शन प्राप्त करता है।
Limitations:
यह निर्धारित करने के लिए आगे के अध्ययन की आवश्यकता है कि प्रस्तावित हाइमा का प्रदर्शन विभिन्न बहु-मॉडल कार्यों और डेटासेटों पर कितना सामान्यीकृत होता है।
हाइपरनेटवर्क के डिजाइन और प्रशिक्षण के लिए अनुकूलन रणनीतियों पर और अधिक शोध की आवश्यकता है।
जैसे-जैसे हाइपरनेटवर्क का आकार बढ़ता है, मेमोरी और कम्प्यूटेशनल संसाधनों की खपत बढ़ने की संभावना होती है।
👍