दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

रैंक मॉडल के लिए काउंटरफैक्टुअल लर्निंग की मजबूती की जांच: एक पुनरुत्पादन अध्ययन

Created by
  • Haebom

लेखक

ज़ेचुन नीउ, ज़ीलिन झांग, जियाक्सिन माओ, क़िंगयाओ ऐ, जी-रोंग वेन

रूपरेखा

यह शोधपत्र व्यापक सिमुलेशन-आधारित प्रयोगों के माध्यम से मौजूदा काउंटरफैक्टुअल रैंकिंग मॉडल (CLTR) की मज़बूती की जाँच करता है। मौजूदा सिमुलेशन अध्ययनों (एक कमज़ोर बेसलाइन रैंकिंग मॉडल का उपयोग करके, एक सरलीकृत उपयोगकर्ता सिमुलेशन मॉडल का उपयोग करके, और एक निश्चित संख्या में सिंथेटिक क्लिक लॉग उत्पन्न करके) को बेहतर बनाने के लिए, हम अलग-अलग प्रदर्शन वाले बेसलाइन रैंकिंग मॉडल, कई उपयोगकर्ता सिमुलेशन मॉडल और सिंथेटिक सत्रों की अलग-अलग संख्या का उपयोग करके प्रयोग करते हैं। हमारे प्रयोगात्मक परिणाम दर्शाते हैं कि IPS-DCM, DLA-PBM, और UPE मॉडल विभिन्न सिमुलेशन सेटिंग्स में अन्य CLTR मॉडलों से बेहतर प्रदर्शन करते हैं। इसके अलावा, हम पाते हैं कि जब बेसलाइन रैंकिंग मॉडल मज़बूत होता है और प्रशिक्षण सत्रों की संख्या सीमित होती है, तो मौजूदा CLTR मॉडल अक्सर साधारण क्लिक बेसलाइन मॉडल से बेहतर प्रदर्शन करने में विफल रहते हैं, जो इन स्थितियों को संबोधित करने वाले नए CLTR एल्गोरिदम की आवश्यकता का सुझाव देता है।

Takeaways, Limitations

Takeaways:
हमने विभिन्न सिमुलेशन सेटिंग्स के तहत IPS-DCM, DLA-PBM और UPE मॉडल की मजबूती का सत्यापन किया।
हमने दिखाया है कि मौजूदा सीएलटीआर मॉडल अक्सर मजबूत बेसलाइन रैंकिंग मॉडल और सीमित संख्या में प्रशिक्षण सत्रों की स्थिति में सरल क्लिक-आधारित मॉडल से बेहतर प्रदर्शन करने में विफल रहते हैं।
इससे मजबूत बेसलाइन रैंकिंग मॉडल और सीमित प्रशिक्षण डेटा स्थितियों के लिए उपयुक्त एक नवीन सीएलटीआर एल्गोरिदम विकसित करने की आवश्यकता उत्पन्न होती है।
Limitations:
चूंकि यह अभी भी सिमुलेशन-आधारित अध्ययन है, इसलिए वास्तविक दुनिया के वातावरण में प्रदर्शन भिन्न हो सकता है।
परिणाम उपयोगकर्ता सिमुलेशन मॉडल और प्रयुक्त बेसलाइन रैंकिंग मॉडल के प्रकार और संख्या से प्रभावित हो सकते हैं।
वास्तविक दुनिया, बड़े पैमाने पर क्लिक लॉग डेटा का उपयोग करके सत्यापन का अभाव।
👍