दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

एन्ट्रॉपी-स्मरण नियम: एलएलएम में डेटा की स्मरण कठिनाई का मूल्यांकन

Created by
  • Haebom

लेखक

यिझान हुआंग, झे यांग, मेइफांग चेन, जियानपिंग झांग, माइकल आर. ल्यू

रूपरेखा

यह शोधपत्र बड़े पैमाने के भाषा मॉडलों (LLM) में प्रशिक्षण डेटा के स्मरण की परिघटना से जुड़े एक मूलभूत प्रश्न पर विचार करता है: हम प्रशिक्षण डेटा को याद रखने की कठिनाई को कैसे चिह्नित कर सकते हैं? OLMo परिवार के खुले मॉडलों का उपयोग करते हुए प्रयोगों के माध्यम से, हम एन्ट्रॉपी-स्मरण नियम का प्रस्ताव करते हैं, जो बताता है कि डेटा एन्ट्रॉपी, स्मरण स्कोर के साथ रैखिक रूप से सहसंबद्ध है। इसके अलावा, अत्यधिक यादृच्छिक स्ट्रिंग्स (अस्पष्ट) को याद रखने के एक केस अध्ययन के माध्यम से, हम देखते हैं कि ये स्ट्रिंग्स, अपनी स्पष्ट यादृच्छिकता के बावजूद, व्यापक प्रशिक्षण कोष की तुलना में अप्रत्याशित रूप से कम अनुभवजन्य एन्ट्रॉपी प्रदर्शित करती हैं। एन्ट्रॉपी-स्मरण नियम की खोज के लिए उपयोग की गई उसी रणनीति को अपनाते हुए, हम डेटासेट इंफ़रेंस (DI) प्राप्त करते हैं, जो प्रशिक्षण और परीक्षण डेटा में अंतर करने का एक सरल लेकिन प्रभावी तरीका है।

____T544_____, ____T545_____

Takeaways:
हम एलएलएम में प्रशिक्षण डेटा के स्मरण की घटना को समझने में डेटा एन्ट्रॉपी के महत्व को प्रस्तुत करते हैं।
हम एन्ट्रॉपी-स्मरण नियम के माध्यम से प्रशिक्षण डेटा की स्मरण कठिनाई की भविष्यवाणी करने की संभावना को प्रदर्शित करते हैं।
हम डेटासेट इंफरेंस (DI) नामक एक नई तकनीक प्रस्तुत करते हैं जो प्रशिक्षण और परीक्षण डेटा के बीच अंतर करने का एक तरीका प्रदान करती है।
Limitations:
चूंकि ये परिणाम ओएलएमओ नामक एक विशिष्ट मॉडल परिवार पर किए गए प्रयोगों पर आधारित हैं, इसलिए यह निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है कि क्या इन्हें अन्य एलएलएम पर सामान्यीकृत किया जा सकता है।
एन्ट्रॉपी-स्मरण नियम के रैखिक सहसंबंध की शक्ति और दायरे का आगे विश्लेषण आवश्यक है।
डेटासेट अनुमान (डीआई) के प्रदर्शन और सीमाओं का व्यापक मूल्यांकन आवश्यक है।
👍