यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है। यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है। पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।
यह शोधपत्र L3AE का परिचय देता है, जो पारंपरिक रैखिक ऑटोएनकोडर (LAE) की सीमाओं को दूर करने की एक प्रस्तावित विधि है। ये LAE, अनुशंसा प्रणालियों में पाठ्य सूचना के अर्थपूर्ण निरूपण को समृद्ध करने के लिए बड़े पैमाने के भाषा मॉडल (LLM) का लाभ उठाते हैं। पारंपरिक LAE, विरल शब्द सह-उपस्थिति पैटर्न पर निर्भर करते हैं, जिससे समृद्ध पाठ्य अर्थ ग्रहण करने की उनकी क्षमता सीमित हो जाती है। L3AE, LLM को LAE ढाँचे में एकीकृत करता है ताकि पाठ्य अर्थ और उपयोगकर्ता-वस्तु अंतःक्रियाओं से प्राप्त विषम जानकारी को प्रभावी ढंग से एकीकृत किया जा सके। इसे प्राप्त करने के लिए, हम एक द्वि-चरणीय अनुकूलन रणनीति का उपयोग करते हैं: LLM से प्राप्त वस्तु निरूपणों का उपयोग करके एक अर्थपूर्ण वस्तु-वस्तु सहसंबंध मैट्रिक्स का निर्माण, और नियमितीकरण के रूप में अर्थपूर्ण वस्तु सहसंबंधों का उपयोग करते हुए सहयोग संकेतों से एक वस्तु-वस्तु भार मैट्रिक्स सीखना। प्रत्येक चरण को एक बंद-रूप समाधान के माध्यम से अनुकूलित किया जाता है, जिससे वैश्विक इष्टतमता और गणनात्मक दक्षता सुनिश्चित होती है। तीन बेंचमार्क डेटासेट पर प्रायोगिक परिणाम दर्शाते हैं कि L3AE लगातार अत्याधुनिक LLM-संवर्धित मॉडलों से बेहतर प्रदर्शन करता है, और Recall@20 पर 27.6% और NDCG@20 पर 39.3% की प्रदर्शन वृद्धि प्राप्त करता है। स्रोत कोड https://github.com/jaewan7599/L3AE_CIKM2025 पर पाया जा सकता है ।
हम पाठ-आधारित अनुशंसा प्रणालियों के प्रदर्शन को बेहतर बनाने के लिए एलएलएम को एलएई ढांचे में प्रभावी ढंग से एकीकृत करने के लिए एक नवीन विधि प्रस्तुत करते हैं।
◦
दो-चरणीय अनुकूलन रणनीति के माध्यम से एक साथ वैश्विक इष्टतमता और कम्प्यूटेशनल दक्षता प्राप्त करना।
◦
मौजूदा अत्याधुनिक मॉडलों की तुलना में प्रयोगात्मक रूप से महत्वपूर्ण प्रदर्शन सुधारों को सत्यापित किया गया।
◦
ओपन सोर्स कोड के माध्यम से पुनरुत्पादन और विस्तारशीलता सुनिश्चित करें।
•
Limitations:
◦
ऐसी संभावना है कि प्रस्तावित मॉडल का प्रदर्शन सुधार एक विशिष्ट डेटासेट तक सीमित हो सकता है।
◦
एलएलएम की कम्प्यूटेशनल लागत और अनुमान समय पर विचार किया जाना चाहिए।
◦
विभिन्न प्रकार के पाठ डेटा और अनुशंसा प्रणालियों के लिए सामान्यीकरण प्रदर्शन सत्यापन की आवश्यकता होती है।