दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

कृत्रिम मानव प्रतिक्रिया के साथ व्याख्या योग्य अनुशंसा

Created by
  • Haebom

लेखक

जियाकाई तांग, जिंगसेन झांग, जिहांग तियान, ज़ुएयांग फेंग, लेई वांग, जू चेन

रूपरेखा

मौजूदा व्याख्या योग्य अनुशंसा प्रणालियों की कमियों को दूर करने के लिए, यह शोधपत्र मानव-सदृश प्रतिक्रिया पर आधारित एक गतिशील अंतःक्रिया अनुकूलन ढाँचा प्रस्तावित करता है। यह ढाँचा मानव प्रतिक्रिया का पूर्वानुमान लगाने के लिए एक बड़े पैमाने के भाषा मॉडल (LLM) को मानव सिम्युलेटर के रूप में उपयोग करता है और उपयोगकर्ता-अनुकूलित पुरस्कार स्कोरिंग पद्धति के माध्यम से LLM की भाषा समझ और तार्किक तर्क क्षमताओं को बढ़ाता है। इसके अलावा, विभिन्न दृष्टिकोणों से व्याख्या की गुणवत्ता के बीच संतुलन बनाने के लिए परेटो अनुकूलन का परिचय दिया गया है, और कुशल मॉडल अधिगम प्राप्त करने के लिए एक ऑफ-पॉलिसी अनुकूलन पाइपलाइन का उपयोग किया गया है। प्रायोगिक परिणाम दर्शाते हैं कि प्रस्तावित विधि मौजूदा विधियों से बेहतर प्रदर्शन करती है।

Takeaways, Limitations

Takeaways:
हम एक नवीन ढांचा प्रस्तुत करते हैं जो मानव-सदृश फीडबैक का लाभ उठाकर व्याख्या योग्य अनुशंसा प्रणालियों के प्रदर्शन में सुधार कर सकता है।
मानवीय प्रतिक्रिया का कुशलतापूर्वक अनुकरण करने और व्यक्तिगत स्पष्टीकरण प्रदान करने के लिए बड़े पैमाने के भाषा मॉडल का लाभ उठाएं।
पेरेटो अनुकूलन के माध्यम से एक साथ कई दृष्टिकोणों से स्पष्टीकरण की गुणवत्ता पर विचार करें।
ऑफ-पॉलिसी अनुकूलन के माध्यम से डेटा उपयोग में वृद्धि करें और मॉडल सामान्यीकरण प्रदर्शन में सुधार करें।
Limitations:
यह एलएलएम के प्रदर्शन पर निर्भर करता है, और एलएलएम पूर्वाग्रह परिणामों को प्रभावित कर सकता है।
उपयोगकर्ता-अनुकूलित पुरस्कार स्कोरिंग पद्धति का डिजाइन व्यक्तिपरक हो सकता है।
विभिन्न डेटासेटों पर सामान्यीकरण प्रदर्शन के अतिरिक्त सत्यापन की आवश्यकता है।
पेरेटो अनुकूलन प्रक्रिया के दौरान कम्प्यूटेशनल लागत बढ़ सकती है।
👍