[공지사항]을 빙자한 안부와 근황 
Show more

दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

एजेंटिक रीजनिंग: एजेंटिक टूल्स के साथ एलएलएम रीजनिंग को बढ़ाने के लिए एक सुव्यवस्थित ढांचा

Created by
  • Haebom

लेखक

जुंडे वू, जियायुआन झू, युयुआन लियू, मिन जू, युमिंग जिन

रूपरेखा

इस पत्र में, हम एक एजेंटिक रीजनिंग ढाँचा प्रस्तुत करते हैं जो बाहरी उपकरण-उपयोग करने वाले एजेंटों को एकीकृत करके बड़े पैमाने के भाषा मॉडल (LLM) की तर्क क्षमता को बढ़ाता है। यह वेब खोज, कोड निष्पादन और संरचित मेमोरी का गतिशील रूप से लाभ उठाकर गहन शोध की आवश्यकता वाली जटिल समस्याओं का समाधान करता है। प्रमुख नवाचार माइंड-मैप एजेंट है, जो अनुमान संदर्भ को संग्रहीत करता है और व्यापक उपकरण उपयोग के कारण दीर्घकालिक अनुमान प्रक्रियाओं के दौरान स्थिरता बनाए रखने के लिए तार्किक संबंधों को ट्रैक करता है। इसके अतिरिक्त, हम एक अत्यधिक कुशल खोज तंत्र विकसित करते हैं जो वेब खोज एजेंटों के व्यापक अन्वेषण के माध्यम से मौजूदा तरीकों से बेहतर प्रदर्शन करता है। डीपसीक-आर1 पर लागू हमारी विधि सार्वजनिक मॉडलों के बीच अत्याधुनिक (SOTA) प्रदर्शन प्राप्त करती है और इस क्षेत्र में एक अग्रणी स्वामित्व मॉडल, ओपनएआई डीप रिसर्च के प्रदर्शन के बराबर है। व्यापक पृथक्करण अध्ययन एजेंट उपकरणों के इष्टतम चयन को सत्यापित करते हैं और माइंड-मैप और वेब खोज एजेंटों की प्रभावशीलता की पुष्टि करते हैं। कोड https://github.com/theworldofagents/Agentic-Reasoning पर पाया जा सकता है ।

Takeaways, Limitations

Takeaways:
हम एजेंट इन्फरेंस प्रस्तुत करते हैं, जो एलएलएम की अनुमान क्षमता को बढ़ाने के लिए एक नवीन ढांचा है।
माइंड मैप एजेंटों के माध्यम से दीर्घकालिक तर्क प्रक्रियाओं की स्थिरता सुनिश्चित करना।
एक अत्यधिक कुशल वेब खोज तंत्र का विकास जो मौजूदा तरीकों से बेहतर प्रदर्शन करता है।
सार्वजनिक मॉडलों के बीच अत्याधुनिक प्रदर्शन प्राप्त करता है और ओपनएआई डीप रिसर्च के बराबर प्रदर्शन प्राप्त करता है।
एजेंट उपकरणों का इष्टतम चयन और एजेंट प्रभावशीलता का सत्यापन।
Limitations:
इस पत्र में प्रस्तुत दृष्टिकोण की सामान्यता निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।
विभिन्न प्रकार की समस्याओं के लिए आगे के निष्पादन मूल्यांकन की आवश्यकता है।
एजेंट अनुमान ढांचे की मापनीयता और दक्षता पर आगे विश्लेषण की आवश्यकता है।
ध्यान दें कि यह एक प्रदर्शन तुलना है, न कि मालिकाना मॉडल, ओपनएआई डीप रिसर्च के साथ प्रत्यक्ष तुलना।
👍