दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

उपभोक्ता GPU पर स्थानीय AI को गति प्रदान करना: YOLOv10s के लिए एक हार्डवेयर-जागरूक गतिशील रणनीति

Created by
  • Haebom

लेखक

महमूदुल इस्लाम मासूम, मियाद इस्लाम, आरिफ आई. सरवत

रूपरेखा

यह शोधपत्र उपभोक्ता-स्तरीय हार्डवेयर पर ऑब्जेक्ट डिटेक्टरों के बेंचमार्क प्रदर्शन और वास्तविक-विश्व व्यवहार्यता के बीच की खाई को पाटने पर केंद्रित है। YOLOv10 जैसे मॉडल जहाँ वास्तविक समय की गति प्राप्त करते हैं, वहीं ये प्रदर्शन मीट्रिक आमतौर पर उच्च-प्रदर्शन वाले डेस्कटॉप-स्तरीय GPU पर प्राप्त होते हैं। RTX 4060 GPU जैसे संसाधन-सीमित सिस्टम पर, हम प्रदर्शित करते हैं कि कम्प्यूटेशनल गति के बजाय, सिस्टम-स्तरीय अड़चनें प्रदर्शन में गिरावट का प्राथमिक कारण हैं। इस समस्या का समाधान करने के लिए, हम एक दो-पास अनुकूली अनुमान एल्गोरिथ्म प्रस्तुत करते हैं जिसे मॉडल आर्किटेक्चर में बदलाव किए बिना लागू किया जा सकता है। यह एल्गोरिथ्म एक तेज़ निम्न-रिज़ॉल्यूशन पास और, आवश्यकता पड़ने पर, एक उच्च-रिज़ॉल्यूशन पास का लाभ उठाकर गति बढ़ाता है। 5,000-इमेज COCO डेटासेट पर PyTorch अर्ली-एग्जिट बेसलाइन की तुलना में, हमें 1.85 गुना गति वृद्धि और 5.51% mAP हानि प्राप्त हुई। शुद्ध मॉडल अनुकूलन पर निर्भर रहने के बजाय, हम हार्डवेयर-जागरूक अनुमान रणनीति के माध्यम से थ्रूपुट को अधिकतम करने के लिए एक व्यावहारिक और पुनरुत्पादनीय दृष्टिकोण प्रस्तुत करते हैं।

Takeaways, Limitations

Takeaways:
उपभोक्ता-ग्रेड हार्डवेयर पर वास्तविक समय वस्तु पहचान प्रदर्शन में सुधार करने के लिए एक व्यावहारिक दृष्टिकोण प्रस्तुत किया गया है।
दो-पास अनुकूली अनुमान एल्गोरिथ्म की प्रभावशीलता का प्रमाण जिसे मॉडल संरचना में बदलाव किए बिना लागू किया जा सकता है।
हार्डवेयर-जागरूक अनुमान रणनीतियों के महत्व पर जोर दें जो हार्डवेयर बाधाओं को ध्यान में रखते हैं।
शीघ्र-निकास और समाधान अनुकूली रूटिंग रणनीतियों के तुलनात्मक विश्लेषण के माध्यम से इष्टतम रणनीतियों के चयन के लिए मानदंडों की प्रस्तुति।
Limitations:
5,000 छवियों वाले COCO डेटासेट का उपयोग करके सामान्यीकरण की आगे की पुष्टि की आवश्यकता है।
ये परिणाम एक विशिष्ट GPU (RTX 4060) के लिए हैं, और अन्य हार्डवेयर वातावरणों पर प्रदर्शन के लिए आगे अनुसंधान की आवश्यकता है।
MAP हानि 5.51% थी, जिसके परिणामस्वरूप सटीकता में कुछ कमी आई। सटीकता और गति के बीच संतुलन बनाने के लिए और सुधार की आवश्यकता है।
एल्गोरिथ्म के अनुप्रयोग का दायरा वस्तु पहचान तक सीमित है, इसलिए अन्य AI मॉडलों के लिए इसकी सामान्यता की जांच की जानी आवश्यक है।
👍