[공지사항]을 빙자한 안부와 근황 
Show more

दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

एलएलएम-रिक्ग: शून्य-शॉट अनुक्रमिक अनुशंसा के लिए एक अर्थगत पूर्वाग्रह-जागरूक ढांचा

Created by
  • Haebom

लेखक

युन्झे ली, जुंटिंग वांग, हरि सुंदरम, झीनिंग लियू

रूपरेखा

इस पत्र में, हम ज़ीरो-शॉट क्रॉस-डोमेन अनुक्रमिक अनुशंसा (ZCDSR) में डोमेन सिमेंटिक पूर्वाग्रह की समस्या के समाधान हेतु एक नवीन ढाँचा प्रस्तावित करते हैं। मौजूदा ZCDSR मॉडलों ने बड़े पैमाने के भाषा मॉडल (LLM) का उपयोग करके क्रॉस-डोमेन ज्ञान हस्तांतरण में सुधार किया है, लेकिन डोमेन के बीच शब्दावली और विषयवस्तु के अंतर के कारण होने वाले सिमेंटिक पूर्वाग्रह के कारण इनकी सटीकता सीमित है। इस पत्र में, हम आइटम स्तर और अनुक्रमिक, दोनों स्तरों पर क्रॉस-डोमेन संरेखण में सुधार करके इस समस्या का समाधान करते हैं। आइटम स्तर पर, हम प्रत्येक डोमेन में आइटम की विशिष्ट विशेषताओं को बनाए रखते हुए डोमेन के बीच समानता सुनिश्चित करने हेतु क्रॉस-डोमेन आइटम एम्बेडिंग को संरेखित करने हेतु एक सामान्यीकरण हानि फ़ंक्शन प्रस्तुत करते हैं। अनुक्रमिक स्तर पर, हम स्रोत डोमेन उपयोगकर्ता अनुक्रमों को समूहीकृत करने और लक्ष्य डोमेन का अनुमान लगाते समय उपयोगकर्ता एम्बेडिंग को गतिशील रूप से अनुकूलित करने हेतु ध्यान-आधारित एकत्रीकरण के माध्यम से उपयोगकर्ता व्यवहार पैटर्न को स्थानांतरित करने की एक विधि विकसित करते हैं। परिणामस्वरूप, हम लक्ष्य डोमेन सहभागिता के बिना प्रभावी ज़ीरो-शॉट अनुशंसा को सक्षम करते हैं।

Takeaways, Limitations

Takeaways:
एलएलएम-आधारित जेडसीडीएसआर के प्रदर्शन को बेहतर बनाने में योगदान देने के लिए एक नया ढांचा प्रस्तुत किया गया है।
आइटम और अनुक्रमिक स्तरों पर डोमेन अर्थगत पूर्वाग्रह समस्याओं को प्रभावी ढंग से हल करता है
सामान्यीकरण हानि फ़ंक्शन के माध्यम से क्रॉस-डोमेन एम्बेडिंग को संरेखित करना और डोमेन के भीतर विविधता बनाए रखना
ध्यान-आधारित उपयोगकर्ता व्यवहार पैटर्न हस्तांतरण के माध्यम से प्रभावी शून्य-शॉट अनुशंसा संभव है
लक्ष्य डोमेन डेटा के बिना नए डोमेन के लिए अनुशंसाएँ संभव हैं
Limitations:
प्रस्तावित ढांचे के वास्तविक प्रदर्शन और सामान्यीकरण क्षमता को निर्धारित करने के लिए अतिरिक्त प्रयोगों और विश्लेषण की आवश्यकता है।
विभिन्न डोमेन और डेटासेट पर प्रयोज्यता को सत्यापित करने की आवश्यकता
कुछ डोमेन में ओवरफिटिंग की संभावना है।
कम्प्यूटेशनल लागत में संभावित वृद्धि
👍