दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

स्ट्रीटव्यूएआई: संदर्भ-जागरूक मल्टीमॉडल एआई का उपयोग करके स्ट्रीट व्यू को सुलभ बनाना

Created by
  • Haebom

लेखक

जॉन ई. फ्रोहलिच, अलेक्जेंडर फियानाका, निमेर जाबेर, विक्टर ज़ारन, शॉन केन

रूपरेखा

StreetViewAI दृष्टिबाधित लोगों के लिए पहला सुलभ सड़क दृश्य उपकरण है। Google स्ट्रीट व्यू (GSV) और मेटा मैपिलरी जैसे इंटरैक्टिव स्ट्रीटस्केप मैपिंग टूल उपयोगकर्ताओं को इमर्सिव 360-डिग्री इमेजरी के माध्यम से वास्तविक दुनिया के वातावरण का आभासी रूप से पता लगाने और अनुभव करने की अनुमति देते हैं, लेकिन वे दृष्टिबाधित लोगों के लिए मूल रूप से दुर्गम हैं। StreetViewAI संदर्भ-जागरूक मल्टीमॉडल AI, सुलभ नेविगेशन नियंत्रण और इंटरैक्टिव वॉइस को मिलाकर इस समस्या का समाधान करता है। StreetViewAI के साथ, दृष्टिबाधित लोग आभासी रूप से गंतव्यों की समीक्षा कर सकते हैं, खुली दुनिया का पता लगा सकते हैं, और GSV के 220 अरब से अधिक छवियों और 100 से अधिक देशों के वितरित संग्रह में आभासी रूप से यात्रा कर सकते हैं। एक मिश्रित-दृष्टि टीम के साथ एक पुनरावृत्त डिज़ाइन प्रक्रिया और 11 दृष्टिबाधित उपयोगकर्ताओं के मूल्यांकन के माध्यम से,

Takeaways, Limitations

Takeaways: दृष्टिबाधित लोगों के लिए एक सुलभ स्ट्रीट व्यू टूल की क्षमता को प्रदर्शित करता है। POI सर्वेक्षणों और दूरस्थ मार्ग नियोजन में इसकी प्रभावशीलता को प्रदर्शित करता है। मल्टीमॉडल AI, सुलभ नेविगेशन नियंत्रणों और संवादात्मक आवाज़ को प्रभावी ढंग से एकीकृत करता है।
Limitations: मूल्यांकन किए गए उपयोगकर्ताओं की संख्या सीमित थी (11)। विभिन्न दृष्टिबाधित और कौशल स्तरों वाले उपयोगकर्ताओं पर और अधिक शोध की आवश्यकता है। दीर्घकालिक उपयोग के दौरान निरंतर उपयोगिता और प्रभावशीलता मूल्यांकन की आवश्यकता है। विविध वातावरणों और स्थितियों में सामान्यीकरण का निर्धारण करने के लिए और अधिक शोध की आवश्यकता है।
👍