दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

EasyEdit2: बड़े भाषा मॉडल को संपादित करने के लिए उपयोग में आसान स्टीयरिंग फ्रेमवर्क

Created by
  • Haebom

लेखक

ज़िवेन जू, शक्सुन वांग, केवेई जू, हाओमिंग जू, मेंगरू वांग, ज़िनले डेंग, युन्झी याओ, गुओझोउ झेंग, हुआजुन चेन, निंग्यु झांग

रूपरेखा

EasyEdit2 एक ऐसा फ्रेमवर्क है जिसे प्लग-एंड-प्ले तरीके से बड़े पैमाने पर भाषा मॉडल (LLM) के व्यवहार को ट्यून करने के लिए डिज़ाइन किया गया है। यह सुरक्षा, भावना, व्यक्तित्व, अनुमान पैटर्न, तथ्यात्मकता और भाषा सुविधाओं सहित परीक्षण-समय हस्तक्षेपों की एक विस्तृत श्रृंखला का समर्थन करता है। अपने पूर्ववर्तियों के विपरीत, इसमें एक नया आर्किटेक्चर है जिसमें स्टीयरिंग वेक्टर जनरेटर और स्टीयरिंग वेक्टर एप्लीकेटर जैसे कोर मॉड्यूल शामिल हैं, जो आपको मापदंडों को संशोधित किए बिना स्टीयरिंग वेक्टर को स्वचालित रूप से उत्पन्न और लागू करके मॉडल के व्यवहार को प्रभावित करने की अनुमति देते हैं। यह केवल एक उदाहरण के साथ मॉडल की प्रतिक्रिया को प्रभावी ढंग से निर्देशित और ट्यून करता है, जिससे सटीक नियंत्रण आसान और कुशल हो जाता है। हम इस तकनीक की प्रभावशीलता को प्रदर्शित करने के लिए विभिन्न LLM पर मॉडल स्टीयरिंग प्रदर्शन की प्रयोगात्मक रूप से रिपोर्ट करते हैं। स्रोत कोड GitHub ( https://github.com/zjunlp/EasyEdit) और एक डेमो वीडियो ( https://www.youtube.com/watch?v=AkfoiPfp5rQ) पर उपलब्ध है ।

Takeaways, Limitations

Takeaways:
एलएलएम के व्यवहार को आसानी से और कुशलतापूर्वक समन्वयित करने के लिए एक नया ढांचा प्रदान करता है।
विशेषज्ञ ज्ञान की आवश्यकता के बिना, एकल उदाहरण से मॉडल व्यवहार को नियंत्रित करें।
बहुमुखी प्रतिभा विभिन्न प्रकार के एलएलएम पर लागू होती है।
यह खुला स्रोत है और इसलिए अत्यधिक सुलभ है।
Limitations:
इस पेपर में विशिष्ट Limitations या सीमाओं के संदर्भ का अभाव है।
विभिन्न एलएलएम में प्रदर्शन तुलना के विस्तृत विवरण का अभाव।
EasyEdit2 के प्रदर्शन को सीमित करने वाले कारकों के विश्लेषण का अभाव (जैसे कुछ प्रकार के हस्तक्षेप के प्रति संवेदनशीलता)।
👍