दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

बड़े भाषा मॉडलों के प्रशिक्षण के बाद एक सर्वेक्षण

Created by
  • Haebom

लेखक

गुइयाओ टाई, ज़ेली झाओ, डिंगजी सॉन्ग, फूयांग वेई, रोंग झोउ, युरोउ दाई, वेन यिन, झेजियान यांग, जियानग्यू यान, याओ सु, झेहान दाई, यिफेंग झी, यिहान काओ, लिचाओ सन, पैन झोउ, लिफांग हे, हेचांग चेन, यू झांग, क्विंगसॉन्ग वेन, तियानमिंग लियू, नील झेंकियांग गोंग, जिलियांग तांग, कैमिंग जिओंग, हेंग जी, फिलिप एस. यू, जियानफेंग गाओ

रूपरेखा

यह शोधपत्र पोस्ट-लर्निंग भाषा मॉडल (PoLMs) का पहला व्यापक सर्वेक्षण प्रस्तुत करता है। बड़े पैमाने के भाषा मॉडल (LLMs) के आगमन ने प्राकृतिक भाषा प्रसंस्करण (NLP) के क्षेत्र में क्रांति ला दी है, लेकिन इनमें सीमित अनुमान क्षमताएँ, नैतिक अनिश्चितताएँ और विशिष्ट क्षेत्रों में खराब प्रदर्शन जैसी सीमाएँ भी हैं। इन चुनौतियों का समाधान करने के लिए, OpenAI-o1/o3 और DeepSeek-R1 जैसे PoLMs (जिन्हें बड़े पैमाने के अनुमान मॉडल, LRMs भी कहा जाता है) सामने आए हैं। यह शोधपत्र पाँच मुख्य प्रतिमानों पर ध्यान केंद्रित करते हुए PoLMs के विकास का व्यवस्थित रूप से पता लगाता है: फ़ाइन-ट्यूनिंग, संरेखण, अनुमान, दक्षता, एकीकरण और अनुकूलन। ChatGPT की संरेखण रणनीति से लेकर DeepSeek-R1 की अभूतपूर्व अनुमान प्रगति तक, हम प्रदर्शित करते हैं कि कैसे PoLMs पूर्वाग्रह को कम करने, अनुमान क्षमताओं को गहन बनाने और क्षेत्र अनुकूलनशीलता को बढ़ाने के लिए डेटासेट का लाभ उठाते हैं। हमारे योगदानों में PoLM विकासों का एक अग्रणी संश्लेषण, तकनीकों और डेटासेट को वर्गीकृत करने वाला एक संरचित वर्गीकरण, और अनुमान क्षमताओं और डोमेन लचीलेपन को बढ़ाने में LRMs की भूमिका को उजागर करने वाला एक रणनीतिक एजेंडा शामिल है। यह अध्ययन PoLM में हालिया प्रगति को एकीकृत करता है और भविष्य के अनुसंधान के लिए एक कठोर बौद्धिक ढाँचा स्थापित करता है, जिससे वैज्ञानिक और सामाजिक अनुप्रयोगों में कठोरता, नैतिक दृढ़ता और बहुमुखी प्रतिभा में उत्कृष्टता प्राप्त करने वाले LLMs के विकास को बढ़ावा मिलता है।

Takeaways, Limitations

Takeaways:
हम PoLM के विकास को व्यवस्थित रूप से व्यवस्थित करते हैं और PoLM अनुसंधान की व्यापक समझ प्रदान करने के लिए पांच मुख्य प्रतिमान प्रस्तुत करते हैं।
हम PoLM तकनीकों और डेटासेट के लिए एक संरचित वर्गीकरण प्रणाली प्रस्तुत करते हैं, तथा भविष्य के अनुसंधान की दिशाएं सुझाते हैं।
हम एलएलएम की तर्क क्षमता और डोमेन लचीलेपन को बढ़ाने के लिए एक रणनीतिक एजेंडा प्रस्तुत करते हैं।
वैज्ञानिक और सामाजिक अनुप्रयोगों में सटीकता, नैतिक मजबूती और बहुमुखी प्रतिभा में उत्कृष्टता प्राप्त करने वाले एलएलएम के विकास में योगदान दें।
Limitations:
यद्यपि यह शोधपत्र PoLM का पहला व्यापक सर्वेक्षण है, फिर भी PoLM क्षेत्र का तीव्र विकास नवीनतम शोध प्रवृत्तियों को पूरी तरह से समाहित नहीं कर सकता है।
विशिष्ट PoLM मॉडल या तकनीकों के गहन विश्लेषण के बजाय, यह समग्र विकास प्रवृत्तियों का अवलोकन प्रदान करने पर ध्यान केंद्रित करता है।
यद्यपि यह भविष्य के अनुसंधान के लिए एक रणनीतिक एजेंडा प्रस्तुत करता है, लेकिन यह विशिष्ट अनुसंधान पद्धति या प्रयोगात्मक डिजाइन पर विवरण प्रदान नहीं करता है।
👍