दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

एक उदाहरण दिखाया, कई अवधारणाएँ ज्ञात! गणितीय LLM में प्रति-उदाहरण-आधारित संकल्पनात्मक तर्क

Created by
  • Haebom

लेखक

यिंगहुई ली, जियायी कुआंग, हाओजिंग हुआंग, झिकुन जू, झिनियन लियांग, यी यू, वेनलियन लू, यांगनिंग ली, शियाओयू टैन, चाओ क्व, यिंग शेन, हाई-ताओ झेंग, फिलिप एस यू

रूपरेखा

यह शोधपत्र बड़े पैमाने के भाषा मॉडल (एलएलएम) पर शोध प्रस्तुत करता है जो गणितीय तर्क और प्रमाण क्षमताओं को बढ़ाने के लिए प्रति-उदाहरणों का उपयोग करते हैं। वर्तमान एलएलएम की एक सीमा है: गणितीय प्रस्तावों को सिद्ध करने की उनकी क्षमता काफी हद तक प्रशिक्षण के दौरान प्रासंगिक प्रमाण प्रक्रियाओं के प्रदर्शन पर निर्भर करती है। इस सीमा को दूर करने के लिए, हम प्रति-उदाहरणों का उपयोग करके प्रमाण विधियों पर ध्यान केंद्रित करते हैं। हमने एलएलएम की प्रति-उदाहरण-आधारित प्रमाण क्षमताओं का मूल्यांकन करने और मॉडल संवर्द्धन हेतु एक डेटा इंजीनियरिंग ढाँचा विकसित करने के लिए, एक उच्च-गुणवत्ता वाला, विश्वविद्यालय-स्तरीय गणित मानक, CounterMATH विकसित किया है। प्रायोगिक परिणाम दर्शाते हैं कि OpenAI o1 जैसे एलएलएम में प्रति-उदाहरण-आधारित प्रमाण क्षमताओं का अभाव है, जो यह दर्शाता है कि एलएलएम की गणितीय क्षमताओं में सुधार के लिए प्रति-उदाहरण-आधारित वैचारिक तर्क को मजबूत करना महत्वपूर्ण है।

____T8772_____, ____T8773_____

Takeaways:
एलएलएम छात्रों में गणितीय तर्क कौशल में सुधार करने के लिए एक नया दृष्टिकोण (प्रति-उदाहरणों का उपयोग करके)
उच्च गुणवत्ता वाले गणित बेंचमार्क, काउंटरमैथ का विकास और विमोचन
एलएलएम में प्रतिउदाहरण-आधारित प्रमाण और सुधार के सुझावों का अभाव
प्रति-उदाहरण-आधारित वैचारिक तर्क कौशल को मजबूत करने के महत्व पर जोर दें।
Limitations:
काउंटरमैथ मैन्युअल रूप से बनाया गया है और इसकी मापनीयता सीमित हो सकती है।
वर्तमान में, एलएलएम की प्रति-उदाहरण-आधारित तर्क क्षमता में सुधार के लिए ठोस समाधानों का अभाव है।
केवल एक विशिष्ट एलएलएम (ओपनएआई O1) के लिए प्रायोगिक परिणाम प्रस्तुत किए गए हैं, जिसके सामान्यीकरण पर आगे अनुसंधान की आवश्यकता है।
👍