दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

HOSt3R: RGB छवियों से की-पॉइंट-मुक्त हैंड-ऑब्जेक्ट 3D पुनर्निर्माण

Created by
  • Haebom

लेखक

अनिलकुमार स्वामी, विंसेंट लेरॉय, फिलिप वेन्जाएपफेल, जीन-एस एबेस्टियन फ्रेंको, जीआर एगोरी रोजेज़

रूपरेखा

यह शोधपत्र मानव-रोबोट अंतःक्रिया और इमर्सिव AR/VR अनुभवों के लिए हाथ-वस्तु 3D पुनर्निर्माण पर केंद्रित है। मौजूदा RGB अनुक्रम-आधारित, वस्तु-स्वतंत्र हाथ-वस्तु पुनर्निर्माण विधियाँ हाथ-वस्तु 3D ट्रैकिंग की दो-चरणीय पाइपलाइन का उपयोग करती हैं, जिसके बाद बहु-दृश्य 3D पुनर्निर्माण होता है। हालाँकि, वे SfM और हाथ की-पॉइंट ऑप्टिमाइज़ेशन जैसी की-पॉइंट डिटेक्शन तकनीकों पर निर्भर करती हैं, जो विविध वस्तु ज्यामिति, कमज़ोर बनावट और पारस्परिक हाथ-वस्तु अवरोधन से जूझती हैं। इन चुनौतियों का समाधान करने के लिए, हम बिना की-पॉइंट डिटेक्टर के मोनोकुलर गति वीडियो/छवियों से हाथ-वस्तु 3D परिवर्तनों का अनुमान लगाने के लिए एक मज़बूत विधि प्रस्तावित करते हैं। इस विधि को एक बहु-दृश्य पुनर्निर्माण पाइपलाइन के साथ एकीकृत करके, हम हाथ-वस्तु 3D आकार को सटीक रूप से पुनर्प्राप्त करते हैं। प्रस्तावित विधि, HOSt3R, अप्रतिबंधित है और पूर्व-स्कैन की गई वस्तु टेम्पलेट्स या कैमरा-आंतरिक मापदंडों पर निर्भर नहीं करती है, जिससे SHOWMe बेंचमार्क पर अत्याधुनिक प्रदर्शन प्राप्त होता है। हम HO3D डेटासेट से अनुक्रमों का उपयोग करके अज्ञात वस्तु श्रेणियों के सामान्यीकरण को भी प्रदर्शित करते हैं।

Takeaways, Limitations

Takeaways:
एक मजबूत हस्त-वस्तु 3D पुनर्निर्माण विधि प्रस्तुत की गई है जो कि मुख्य बिंदु डिटेक्टरों पर निर्भर नहीं करती है।
पूर्व-स्कैन किए गए ऑब्जेक्ट टेम्पलेट्स या आंतरिक कैमरा मापदंडों की कोई आवश्यकता नहीं
SHOWMe बेंचमार्क में अत्याधुनिक प्रदर्शन प्राप्त करना
अज्ञात वस्तु श्रेणियों के लिए सामान्यीकरण का प्रदर्शन
Limitations:
वास्तविक दुनिया के वातावरण में प्रदर्शन और स्थिरता का आगे मूल्यांकन आवश्यक है।
विभिन्न प्रकाश स्थितियों और पृष्ठभूमियों में मजबूती का आकलन आवश्यक है।
जटिल हाथ-वस्तु अंतःक्रियाओं के लिए प्रदर्शन विश्लेषण की आवश्यकता है।
👍