यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है। यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है। पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।
यह शोधपत्र न्यूनतम इनवेसिव एंडोस्कोपिक सर्जरी में गहराई आकलन के महत्व पर ज़ोर देता है और पारंपरिक CNN-आधारित गहराई आकलन नेटवर्क की सीमाओं को दूर करने के लिए फाउंडेशन मॉडल का उपयोग करते हुए एक नवीन फ़ाइन-ट्यूनिंग रणनीति प्रस्तुत करता है। विशेष रूप से, हम एंडोस्कोपिक छवियों में अनुकूलित गहराई आकलन के लिए डेप्थ एनीथिंग मॉडल पर आधारित एक अंतर्निहित अप्रशिक्षित मोनोकुलर गहराई आकलन ढाँचा प्रस्तावित करते हैं। यह विभिन्न पैमानों के लिए अनुकूलन क्षमता को बढ़ाने और ट्रांसफ़ॉर्मर की स्थानीय फ़ीचर लर्निंग की सीमाओं को पूरा करने के लिए एक यादृच्छिक वेक्टर-आधारित निम्न-श्रेणी अनुकूलन तकनीक और एक गहराई-पृथक कनवल्शन-आधारित अवशिष्ट ब्लॉक को एकीकृत करता है। SCARED और हैमलिन डेटासेट पर प्रायोगिक परिणाम दर्शाते हैं कि प्रस्तावित विधि सीखने योग्य मापदंडों की संख्या को न्यूनतम रखते हुए अत्याधुनिक प्रदर्शन प्राप्त करती है।
Takeaways, Limitations
•
Takeaways:
◦
हमने फाउंडेशन मॉडल का उपयोग करके एंडोस्कोपिक छवियों के गहराई आकलन प्रदर्शन में सुधार किया।
◦
हमने निम्न-रैंक अनुकूलन तकनीकों और गहराई-पृथक कनवल्शन-आधारित अवशिष्ट ब्लॉकों के माध्यम से मॉडल की दक्षता और सटीकता में सुधार किया।
◦
यह न्यूनतम इनवेसिव एंडोस्कोपिक सर्जरी की सटीकता और सुरक्षा को बेहतर बनाने में योगदान दे सकता है।
◦
हम न्यूनतम सीखने योग्य मापदंडों के साथ अत्याधुनिक प्रदर्शन प्राप्त करते हैं।
•
Limitations:
◦
प्रस्तावित विधि का प्रदर्शन विशिष्ट डेटासेट (SCARED और हैमलिन) पर प्राप्त परिणामों पर आधारित है, तथा अन्य डेटासेट पर सामान्यीकरण प्रदर्शन के लिए आगे अध्ययन की आवश्यकता है।
◦
एंडोस्कोपिक छवियों की विभिन्न स्थितियों (प्रकाश, गति, आदि) के प्रति मजबूती का आगे मूल्यांकन आवश्यक है।
◦
वास्तविक सर्जिकल वातावरण में वास्तविक समय प्रसंस्करण प्रदर्शन का सत्यापन आवश्यक है।