यह शोधपत्र MaRVL-QA प्रस्तुत करता है, जो बहुविधीय वृहत्-स्तरीय भाषा मॉडल (MLLM) की गणितीय और स्थानिक तर्क क्षमताओं के मूल्यांकन हेतु एक नवीन मानक है। MaRVL-QA को गणितीय सतह आरेखों का उपयोग करके, बिना किसी अर्थगत शोर के, विशुद्ध रूप से तर्क क्षमताओं का आकलन करने के लिए डिज़ाइन किया गया है। इसमें दो नवीन कार्य शामिल हैं: टोपोलॉजिकल कंप्यूटेशन, जो स्थानीय उच्चिष्ठ जैसे लक्षणों की पहचान और गणना करता है, और रूपांतरण पहचान, जो ज्यामितीय परिवर्तनों को पहचानता है। प्रायोगिक परिणाम दर्शाते हैं कि अत्याधुनिक MLLM भी सुदृढ़ स्थानिक तर्क के बजाय सतही अनुमानों पर निर्भर करते हैं। MaRVL-QA, MLLM की तर्क क्षमताओं को बेहतर बनाने के उद्देश्य से किए जा रहे अनुसंधान में योगदान देगा।