[공지사항]을 빙자한 안부와 근황 
Show more

दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

महत्वपूर्ण बातें सीखना: मॉडल फ़ाइनट्यूनिंग के लिए पारस्परिक सूचना के माध्यम से संभाव्य कार्य चयन

Created by
  • Haebom

लेखक

प्रतीक चंदा, सरल सुरेका, पार्थ प्रतिम चटर्जी, कृष्णतेजा किलामसेट्टी, निखिल शिवकुमार नायक, गणेश रामकृष्णन

रूपरेखा

इस पत्र में, हम दर्शाते हैं कि बड़े पैमाने के भाषा मॉडल (LLM) का फ़ाइन-ट्यूनिंग प्रदर्शन प्रशिक्षण डेटा मिश्रण संरचना पर अत्यधिक निर्भर करता है, लेकिन इष्टतम डेटा मिश्रण अनुपात का चयन एक मैनुअल और अनुमान-निर्भर प्रक्रिया है। इसलिए, हम TASKPGM प्रस्तुत करते हैं, जो एक व्यवस्थित और मापनीय ढाँचा है जो मार्कोव रैंडम फ़ील्ड (MRF) पर एक ऊर्जा फ़ंक्शन को न्यूनतम करके निरंतर कार्य अनुपातों का चयन करता है। TASKPGM, जेन्सन शैनन डाइवर्जेंस और पॉइंटवाइज़ म्यूचुअल इन्फ़ॉर्मेशन जैसे व्यवहारगत अंतरों का उपयोग करके कार्य संबंधों को मॉडल करता है, जो एकल-कार्य फ़ाइन-ट्यूनिंग मॉडल के पूर्वानुमानित वितरण से गणना किए जाते हैं। यह समूह बाधाओं के अंतर्गत बंद-रूप समाधान प्रदान करता है और कार्यों में प्रतिनिधित्व और विविधता के संतुलन की गारंटी देता है। यह Llama 2 और Mistral के साथ-साथ MMLU और BIGBench जैसे मूल्यांकन सेटों पर लगातार अनुभवजन्य प्रदर्शन लाभ दर्शाता है, जिससे कार्य प्रभाव और मिश्रण संरचना में व्याख्या योग्य अंतर्दृष्टि मिलती है।

Takeaways, Limitations

Takeaways:
एलएलएम फाइन-ट्यूनिंग के लिए एक व्यवस्थित और स्केलेबल डेटा ब्लेंडिंग ऑप्टिमाइज़ेशन फ्रेमवर्क, टास्कपीजीएम, प्रस्तुत किया गया है।
एकल-कार्य फ़ाइन-ट्यूनिंग मॉडल के पूर्वानुमानित वितरण का उपयोग करके कार्य संबंधों का मॉडलिंग करना, प्रतिनिधित्व और विविधता के बीच संतुलन प्राप्त करना।
लामा 2 और मिस्ट्रल पर MMLU और BIGBench जैसे मूल्यांकन सेटों पर प्रदर्शन सुधार प्रदर्शित करता है
कार्य प्रभाव और मिश्रित संरचना में व्याख्या योग्य अंतर्दृष्टि प्रदान करता है
Limitations:
TASKPGM के व्यावहारिक अनुप्रयोग के लिए आवश्यक कम्प्यूटेशनल संसाधनों पर चर्चा का अभाव।
विभिन्न एलएलएम आर्किटेक्चर और डेटासेट पर सामान्यीकरण पर आगे अनुसंधान की आवश्यकता है।
प्रस्तावित व्यवहारगत अंतरों से परे अन्य प्रकार के कार्य संबंध मॉडलिंग तरीकों का पता लगाने की आवश्यकता है।
👍