यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है। यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है। पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।
यह शोधपत्र एक ओपन-सोर्स लार्ज-स्केल लैंग्वेज मॉडल (LLM) की डेटा विश्लेषण क्षमताओं को बेहतर बनाने की रणनीतियों की पड़ताल करता है। विभिन्न यथार्थवादी परिदृश्यों से युक्त एक सीड डेटासेट का उपयोग करके, हम तीन प्रमुख आयामों में मॉडल के प्रदर्शन का मूल्यांकन करते हैं: डेटा समझ, कोड निर्माण और रणनीतिक योजना। हमारे विश्लेषण से तीन प्रमुख निष्कर्ष सामने आए हैं: रणनीतिक योजना की गुणवत्ता मॉडल प्रदर्शन का एक प्रमुख निर्धारक है; इंटरेक्शन डिज़ाइन और कार्य जटिलता अनुमान प्रदर्शन को महत्वपूर्ण रूप से प्रभावित करते हैं; और इष्टतम प्रदर्शन प्राप्त करने में डेटा गुणवत्ता का विविधता से अधिक प्रभाव पड़ता है। इन जानकारियों के आधार पर, हम ओपन-सोर्स LLM की विश्लेषणात्मक अनुमान क्षमताओं को महत्वपूर्ण रूप से बेहतर बनाने के लिए एक डेटा संश्लेषण पद्धति विकसित करते हैं। कोड https://github.com/zjunlp/DataMind पर उपलब्ध है ।