दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

सत्य की ज्यामिति सभी कार्यों में लंबवत होती है

Created by
  • Haebom

लेखक

वैस अज़ीज़ियन, माइकल किरचहोफ़, यूजीन एनडियाये, लुईस बेथ्यून, मिशाल क्लेन, पियरे एबलिन, मार्को कटुरी

रूपरेखा

यह शोधपत्र पिछले अध्ययनों की सीमाओं को इंगित करता है जो बड़े पैमाने पर भाषा मॉडल (LLM) की विश्वसनीयता समस्या को हल करने के लिए सक्रियण वैक्टर का उपयोग करके उत्तरों की सटीकता का मूल्यांकन करते हैं। पिछले अध्ययनों का दावा है कि किसी विशिष्ट कार्य में उत्पन्न सही और गलत सक्रियण वैक्टर के बीच अंतर करने के लिए रैखिक क्लासिफायर का उपयोग करके "सत्य की ज्यामिति" सीखी जा सकती है। हालाँकि, यह शोधपत्र दर्शाता है कि यह "सत्य की ज्यामिति" कार्यों में काफी भिन्न होती है और विभिन्न कार्यों में स्थानांतरित नहीं होती है। विशेष रूप से, हम प्रयोगात्मक रूप से साबित करते हैं कि विभिन्न कार्यों पर प्रशिक्षित रैखिक क्लासिफायर में बहुत कम समानता होती है, और विशेष रूप से जब विरलता-प्रवर्तन नियमितकर्ता का उपयोग किया जाता है, तो वे बहुत कम ओवरलैप करते हैं। हम यह भी दिखाते हैं कि मिश्रित-जांच या बहु-कार्य दृष्टिकोण इन सीमाओं को दूर करने में विफल होते हैं, और हम तर्क देते हैं कि ऐसा इसलिए है क्योंकि कार्यों में सक्रियण वैक्टर स्पष्ट रूप से अलग-अलग क्लस्टर बनाते हैं।

Takeaways, Limitations

Takeaways: हम एलएलएम की विश्वसनीयता आकलन के लिए सक्रियण वेक्टर-आधारित दृष्टिकोण की सीमाओं को स्पष्ट रूप से प्रस्तुत करते हैं, और भविष्य के शोध दिशाओं का सुझाव देते हैं। हम एक ही कार्य के लिए विशेषीकृत "सत्य की ज्यामिति" सीखने की समस्याओं को इंगित करते हैं, और अधिक मजबूत और सामान्यीकृत विश्वसनीयता आकलन विधियों की आवश्यकता पर जोर देते हैं।
Limitations: यह अध्ययन विशिष्ट सक्रियण वैक्टर और रैखिक क्लासिफायर के उपयोग तक सीमित है, और अन्य प्रकार के सक्रियण वैक्टर या क्लासिफायर का उपयोग करने पर परिणाम भिन्न हो सकते हैं। इसके अलावा, विभिन्न LLM आर्किटेक्चर या कार्य प्रकारों के लिए सामान्यीकरण पर आगे अनुसंधान की आवश्यकता है। यद्यपि "सत्य की ज्यामिति" की कार्य निर्भरता को दिखाया गया था, लेकिन कारण का गहन विश्लेषण नहीं किया गया है।
👍