दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

मल्टी-एजेंट लार्ज लैंग्वेज मॉडल सिस्टम पर आधारित स्कीमा-निर्देशित दृश्य-ग्राफ़ तर्क

Created by
  • Haebom

लेखक

यीये चेन, हरप्रीत साहनी, निकोलस गिड ई, यानान जियान, जैक सॉन्डर्स, पेट्रीसियो वेला, बेन लुंडेल

रूपरेखा

यह शोधपत्र एक दृश्य ग्राफ़ को एक बड़े पैमाने के भाषा मॉडल (LLM) पर आधारित स्थानिक तर्क के लिए एक संरचित और क्रमिक पर्यावरणीय निरूपण के रूप में प्रस्तुत करता है। हम SG² का प्रस्ताव करते हैं, जो एक बहु-एजेंट LLM पर आधारित एक पुनरावृत्तीय, स्कीमा-आधारित दृश्य ग्राफ़ अनुमान ढाँचा है। प्रत्येक एजेंट में दो मॉड्यूल होते हैं: एक तर्ककर्ता मॉड्यूल (रीज़नर), जो अमूर्त कार्यों की योजना बनाता है और ग्राफ़ सूचना क्वेरीज़ उत्पन्न करता है, और एक पुनर्प्राप्ति मॉड्यूल (रिट्रीवर), जो क्वेरीज़ के आधार पर कोड लिखकर प्रासंगिक ग्राफ़ सूचनाएँ निकालता है। ये दोनों मॉड्यूल ग्राफ़ सूचना पर अनुक्रमिक अनुमान और अनुकूली ध्यान को सक्षम करने के लिए पुनरावृत्तीय रूप से सहयोग करते हैं। दोनों मॉड्यूल को प्रस्तुत एक दृश्य ग्राफ़ स्कीमा अनुमान और पुनर्प्राप्ति प्रक्रियाओं को सुव्यवस्थित करती है और उनके सहयोग का मार्गदर्शन करती है। इससे LLM को संपूर्ण ग्राफ़ डेटा प्रस्तुत करने की आवश्यकता समाप्त हो जाती है, जिससे अप्रासंगिक सूचना के कारण होने वाले मतिभ्रम की संभावना कम हो जाती है। विभिन्न अनुरूपित वातावरणों में किए गए प्रयोगों से पता चलता है कि प्रस्तावित ढांचा संख्यात्मक प्रश्न-उत्तर और नियोजन कार्यों पर मौजूदा एलएलएम-आधारित दृष्टिकोणों और आधारभूत एकल-एजेंट, उपकरण-आधारित तर्क-प्राप्ति रणनीतियों से बेहतर प्रदर्शन करता है।

Takeaways, Limitations

Takeaways:
बहु-एजेंट एलएलएम पर आधारित पुनरावृत्तीय अनुमान ढांचे के माध्यम से एलएलएम के स्थानिक अनुमान प्रदर्शन में सुधार करना।
दृश्य ग्राफ स्कीमा का लाभ उठाकर एलएलएम में मतिभ्रम की समस्या को कम करना और अनुमान दक्षता को बढ़ाना।
एकाधिक सिमुलेशन वातावरणों में सत्यापित मौजूदा एकल-एजेंट विधियों की तुलना में बेहतर प्रदर्शन।
संख्यात्मक प्रश्न-उत्तर और योजना कार्यों में प्रभावी प्रदर्शन का प्रदर्शन किया।
Limitations:
प्रस्तावित ढांचे की सामान्यता निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।
विभिन्न प्रकार के दृश्य ग्राफ और जटिल वातावरण के लिए प्रयोज्यता सत्यापन आवश्यक है।
वास्तविक दुनिया के वातावरण में प्रदर्शन मूल्यांकन और प्रयोज्यता अध्ययन की आवश्यकता है।
बहु-एजेंट एलएलएम के बीच कुशल सहयोग रणनीतियों पर आगे अनुसंधान की आवश्यकता है।
👍