यह शोधपत्र मौजूदा इंटरैक्टिव डिजिटल मानचित्रों की सीमाओं पर प्रकाश डालता है, जो दुनिया के बारे में दृश्य प्रश्नों के उत्तर देने के लिए GIS डेटाबेस पर निर्भर करते हैं। इस सीमा को दूर करने के लिए, हम जियो-विजुअल एजेंट्स की अवधारणा प्रस्तावित करते हैं। जियो-विजुअल एजेंट्स बहु-मोडल AI एजेंट हैं जो बड़े पैमाने के भू-स्थानिक छवि संग्रहों, जैसे कि सड़क के दृश्य, स्थान-आधारित फ़ोटो और हवाई फ़ोटो, और साथ ही मौजूदा GIS डेटा का विश्लेषण करके दृश्य स्थानिक प्रश्नों को समझने और उनका उत्तर देने में सक्षम हैं। यह शोधपत्र इन जियो-विजुअल एजेंटों के लिए दृष्टिकोण को परिभाषित करता है, उनकी संवेदन और अंतःक्रिया विधियों का वर्णन करता है, तीन उदाहरण प्रस्तुत करता है, और भविष्य के अनुसंधान के लिए प्रमुख चुनौतियों और अवसरों की रूपरेखा प्रस्तुत करता है।