दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

एक टूलबॉक्स, हथौड़ा नहीं - मल्टी-टैग: मल्टी-टूल एग्रीगेशन के साथ गणितीय तर्क को मापना

Created by
  • Haebom

लेखक

बोहन याओ, विकास यादव

रूपरेखा

इस पत्र में, हम मल्टी-टैग (Multi-TAG) का प्रस्ताव करते हैं, जो बड़े पैमाने के भाषा मॉडलों (LLM) की गणितीय अनुमान क्षमताओं को बेहतर बनाने के लिए एक बहु-उपकरण एकत्रीकरण ढाँचा है। मौजूदा एकल-उपकरण दृष्टिकोणों के विपरीत, मल्टी-टैग प्रत्येक अनुमान चरण में एक साथ कई उपकरणों का उपयोग करता है और अनुमान प्रक्रिया को सत्यापित और बेहतर बनाने के लिए उनके परिणामों को एकत्रित करता है। यह ढाँचा केवल अनुमान चरण पर ही कार्य करता है, इसमें किसी प्रकार के फाइन-ट्यूनिंग की आवश्यकता नहीं होती है, जिससे यह बड़े पैमाने के खुले मॉडलों और स्वामित्व वाले अत्याधुनिक मॉडलों पर लागू होता है। MATH500, AIME, AMC, और OlympiadBench जैसे जटिल बेंचमार्क पर, इसने पिछले सर्वश्रेष्ठ प्रदर्शन करने वाले मॉडलों की तुलना में औसतन 6.0% से 7.5% का प्रदर्शन सुधार हासिल किया।

Takeaways, Limitations

Takeaways:
एलएलएम छात्रों में गणितीय तर्क कौशल में सुधार के लिए एक प्रभावी बहु-उपकरण उपयोग रणनीति प्रस्तुत करना।
यह केवल अनुमान आधारित ढांचा है, जिसमें किसी सुधार की आवश्यकता नहीं है, तथा यह विभिन्न LLMs में इसकी प्रयोज्यता का विस्तार करता है।
जटिल गणितीय समस्याओं को हल करने की अपनी क्षमता में सुधार करें और अपने समाधानों की मजबूती और सटीकता में सुधार करें।
विभिन्न बेंचमार्क में मौजूदा सर्वश्रेष्ठ प्रदर्शन करने वाले मॉडलों की तुलना में प्रयोगात्मक रूप से सत्यापित प्रदर्शन सुधार।
Limitations:
प्रस्तुत मानदंडों से परे अन्य प्रकार की गणितीय समस्याओं के सामान्यीकरण प्रदर्शन के लिए आगे अध्ययन की आवश्यकता है।
एक साथ कई उपकरणों के उपयोग के कारण कम्प्यूटेशनल लागत में संभावित वृद्धि।
उपयोग किये गए उपकरणों की गुणवत्ता से प्रदर्शन प्रभावित हो सकता है।
👍