दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

मेमोरी-प्रतिबंधित उपकरणों के लिए हल्के गहन शिक्षण मॉडल का तुलनात्मक विश्लेषण

Created by
  • Haebom

लेखक

तस्नीम शहरियार

रूपरेखा

यह शोधपत्र संसाधन-सीमित वातावरणों (जैसे, कम मेमोरी वाले उपकरणों) में परिनियोजन के लिए उपयुक्त हल्के डीप लर्निंग मॉडलों का एक व्यापक मूल्यांकन प्रस्तुत करता है। हमने पाँच अत्याधुनिक आर्किटेक्चर—मोबाइलनेटवी3 स्मॉल, रेसनेट18, स्क्वीज़नेट, एफिशिएंटनेटवी2-एस, और शफलनेटवी2—का तीन विविध डेटासेट्स: CIFAR-10, CIFAR-100, और टाइनी इमेजनेट पर बेंचमार्क किया है। हम चार प्रमुख प्रदर्शन मानकों का उपयोग करके मॉडलों का मूल्यांकन करते हैं: वर्गीकरण सटीकता, अनुमान समय, फ्लोटिंग-पॉइंट ऑपरेशन (FLOPs), और मॉडल आकार। हम हाइपरपैरामीटर ट्यूनिंग, डेटा संवर्द्धन और प्रशिक्षण प्रतिमानों के प्रभाव की जाँच करने के लिए पूर्व-प्रशिक्षित मॉडलों की तुलना नए सिरे से प्रशिक्षित मॉडलों से करते हैं। हमने पाया है कि ट्रांसफर लर्निंग, विशेष रूप से टाइनी इमेजनेट जैसे जटिल डेटासेट्स पर, मॉडल सटीकता और कम्प्यूटेशनल दक्षता में उल्लेखनीय सुधार करती है। EfficientNetV2 लगातार उच्चतम सटीकता प्राप्त करता है, MobileNetV3 सटीकता और दक्षता के बीच सर्वोत्तम संतुलन प्रदान करता है, और SqueezeNet अनुमान लगाने की गति और संक्षिप्तता में उत्कृष्ट है। यह अध्ययन सटीकता और दक्षता के बीच महत्वपूर्ण संतुलन को उजागर करता है, और सीमित कम्प्यूटेशनल संसाधनों वाले वास्तविक-विश्व अनुप्रयोगों में हल्के मॉडलों को परिनियोजित करने के लिए क्रियाशील अंतर्दृष्टि प्रदान करता है।

Takeaways, Limitations

Takeaways:
ट्रांसफर लर्निंग हल्के मॉडलों की सटीकता और दक्षता में सुधार करती है, विशेष रूप से जटिल डेटासेट पर।
EfficientNetV2 उच्च सटीकता प्रदान करता है, MobileNetV3 सटीकता और दक्षता के बीच संतुलन प्रदान करता है, और SqueezeNet तीव्र अनुमान गति और छोटा आकार प्रदान करता है।
संसाधन-सीमित वातावरण में हल्के मॉडलों को तैनात करने के लिए कार्रवाई योग्य मार्गदर्शन प्रदान करता है।
एज कंप्यूटिंग और मोबाइल प्लेटफॉर्म के लिए डीप लर्निंग सिस्टम को अनुकूलित करने में योगदान देता है।
Limitations:
मूल्यांकन के लिए उपयोग किये जाने वाले डेटासेट की संख्या और प्रकार सीमित हो सकते हैं।
अधिक विविध हाइपरपैरामीटर संयोजनों और सीखने की रणनीतियों की खोज आवश्यक हो सकती है।
वास्तविक अनुप्रयोग वातावरण में प्रदर्शन मूल्यांकन में कमी हो सकती है।
👍