यह शोधपत्र एक दृश्य ग्राफ़ को एक बड़े पैमाने के भाषा मॉडल (LLM) पर आधारित स्थानिक तर्क के लिए एक संरचित और क्रमिक पर्यावरणीय निरूपण के रूप में प्रस्तुत करता है। हम SG² का प्रस्ताव करते हैं, जो एक बहु-एजेंट LLM पर आधारित एक पुनरावृत्तीय, स्कीमा-आधारित दृश्य ग्राफ़ अनुमान ढाँचा है। प्रत्येक एजेंट में दो मॉड्यूल होते हैं: एक तर्ककर्ता मॉड्यूल (रीज़नर), जो अमूर्त कार्यों की योजना बनाता है और ग्राफ़ सूचना क्वेरीज़ उत्पन्न करता है, और एक पुनर्प्राप्ति मॉड्यूल (रिट्रीवर), जो क्वेरीज़ के आधार पर कोड लिखकर प्रासंगिक ग्राफ़ सूचनाएँ निकालता है। ये दोनों मॉड्यूल ग्राफ़ सूचना पर अनुक्रमिक अनुमान और अनुकूली ध्यान को सक्षम करने के लिए पुनरावृत्तीय रूप से सहयोग करते हैं। दोनों मॉड्यूल को प्रस्तुत एक दृश्य ग्राफ़ स्कीमा अनुमान और पुनर्प्राप्ति प्रक्रियाओं को सुव्यवस्थित करती है और उनके सहयोग का मार्गदर्शन करती है। इससे LLM को संपूर्ण ग्राफ़ डेटा प्रस्तुत करने की आवश्यकता समाप्त हो जाती है, जिससे अप्रासंगिक सूचना के कारण होने वाले मतिभ्रम की संभावना कम हो जाती है। विभिन्न अनुरूपित वातावरणों में किए गए प्रयोगों से पता चलता है कि प्रस्तावित ढांचा संख्यात्मक प्रश्न-उत्तर और नियोजन कार्यों पर मौजूदा एलएलएम-आधारित दृष्टिकोणों और आधारभूत एकल-एजेंट, उपकरण-आधारित तर्क-प्राप्ति रणनीतियों से बेहतर प्रदर्शन करता है।