दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

चार्ट-R1: उन्नत चार्ट रीज़नर के लिए विचार-श्रृंखला पर्यवेक्षण और सुदृढ़ीकरण

Created by
  • Haebom

लेखक

लेई चेन, जुआनले झाओ, ज़िक्सिओनग ज़ेंग, जिंग हुआंग, युफ़ेंग झोंग, लिन मा

रूपरेखा

यह शोधपत्र चार्ट-R1 मॉडल प्रस्तुत करता है, जो चार्ट क्षेत्र में जटिल अनुमान के लिए सुदृढीकरण अधिगम फ़ाइन-ट्यूनिंग पर आधारित R1-शैली पद्धति को लागू करता है। गणितीय तर्क और कोड इंटेलिजेंस पर केंद्रित मौजूदा R1-शैली पद्धतियों के विपरीत, चार्ट-R1 अधिक सामान्य बहुविध डेटा, विशेष रूप से चार्ट डेटा, के लिए अनुमान क्षमताओं को बढ़ाता है। इसे प्राप्त करने के लिए, हम एक नवीन प्रोग्रामेटिक डेटा संश्लेषण तकनीक का प्रस्ताव करते हैं जो एकल और एकाधिक उप-चार्टों वाले उच्च-गुणवत्ता वाले चरण-दर-चरण चार्ट अनुमान डेटा उत्पन्न करती है। हम एक द्वि-चरणीय अधिगम रणनीति भी विकसित करते हैं: चार्ट-COT, जो एक चेन-ऑफ-थॉट (COT) मानचित्र का उपयोग करता है, और चार्ट-RFT, जो संख्यात्मक संवेदनशीलता फ़ाइन-ट्यूनिंग का उपयोग करता है। चार्ट-COT जटिल अनुमान कार्यों को सूक्ष्म उप-कार्यों में विघटित करता है, जबकि चार्ट-RFT संख्यात्मक प्रतिक्रियाओं के लिए अपेक्षाकृत सौम्य पुरस्कारों का उपयोग करके चार्ट क्षेत्र में संख्यात्मक संवेदनशीलता पर ज़ोर देता है। प्रायोगिक परिणाम दर्शाते हैं कि चार्ट-आर1 मौजूदा चार्ट डोमेन विधियों से बेहतर प्रदर्शन करता है और यह जीपीटी-4o और क्लाउड-3.5 जैसे बड़े पैमाने के मॉडलों के बराबर है।

Takeaways, Limitations

Takeaways:
मल्टीमॉडल डेटा, विशेष रूप से चार्ट डेटा के साथ जटिल अनुमान समस्याओं के लिए सुदृढीकरण सीखने-आधारित आर1-शैली पद्धति को सफलतापूर्वक लागू करना।
नई प्रोग्रामेटिक डेटा संश्लेषण तकनीकों के साथ चार्ट अनुमान डेटा की कमी की समस्या का समाधान करना।
एक प्रभावी दो-चरणीय शिक्षण रणनीति प्रस्तुत की गई है जो काउंटरफैक्टुअल (सीओटी) और संख्यात्मक संवेदनशीलता वृद्धि फाइन-ट्यूनिंग (आरएफटी) को जोड़ती है।
मौजूदा तरीकों और बड़े पैमाने के मॉडलों की तुलना में बेहतर प्रदर्शन का प्रदर्शन किया।
Limitations:
प्रस्तावित डेटा संश्लेषण तकनीक के सामान्यीकरण प्रदर्शन और सीमाओं पर आगे अनुसंधान की आवश्यकता है।
कुछ प्रकार के चार्ट डेटा के प्रति संभावित पूर्वाग्रह होता है। विभिन्न प्रकार के चार्ट डेटा के लिए प्रदर्शन मूल्यांकन आवश्यक है।
प्रयुक्त पुरस्कार फ़ंक्शन के डिज़ाइन और अनुकूलन पर आगे अनुसंधान की आवश्यकता है।
बड़े पैमाने के मॉडलों के साथ तुलना करते समय विशिष्ट मेट्रिक्स के लिए प्रदर्शन अंतर का विश्लेषण आवश्यक है।
👍