यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है। यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है। पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।
यह शोधपत्र व्यवहार्यता-आधारित निष्पक्ष अनुकूली सुदृढीकरण अधिगम (FG-FARL) प्रस्तुत करता है, जो एक ऑफ़लाइन सुदृढीकरण अधिगम प्रक्रिया है जो समूह-विशिष्ट सुरक्षा सीमाओं को समायोजित करके हानि को कम करती है और संरक्षित उपसमूहों में चयनित निष्पक्षता उद्देश्य (दायरा या हानि) को समान बनाती है। मेडिकेड जनसंख्या स्वास्थ्य प्रबंधन कार्यक्रम से प्राप्त अनाम अनुदैर्ध्य डेटा का उपयोग करते हुए, हम व्यवहार प्रतिकृति (BC) और HACO (हाइब्रिड अनुकूली अनुकूली ऑफ़लाइन सुदृढीकरण अधिगम; वैश्विक रूप से अनुकूली सुरक्षा मानदंड) के विरुद्ध FG-FARL का मूल्यांकन करते हैं। हम बूटस्ट्रैप्ड 95% विश्वास अंतरालों और p-मानों का उपयोग करते हुए उपसमूह असंतुलन विश्लेषण परिणामों के साथ ऑफ-पॉलिसी मान अनुमानों की रिपोर्ट करते हैं। FG-FARL निष्पक्षता मेट्रिक्स में सुधार करता है और आधार रेखाओं के तुलनीय मान प्राप्त करता है, जिससे सुरक्षित और निष्पक्ष निर्णय समर्थन के लिए एक व्यावहारिक दृष्टिकोण प्राप्त होता है।
Takeaways, Limitations
•
Takeaways:
◦
एफजी-एफएआरएल ऑफलाइन सुदृढीकरण सीखने के वातावरण में निष्पक्षता और सुरक्षा में एक साथ सुधार करने के लिए एक व्यावहारिक विधि प्रस्तुत करता है।
◦
हम यह प्रदर्शित करते हैं कि विभिन्न समूहों में सुरक्षा सीमा को समायोजित करने से संरक्षित उपसमूहों के बीच असमानता कम हो सकती है।
◦
हमने वास्तविक चिकित्सा डेटा का उपयोग करके प्रयोगों के माध्यम से एल्गोरिथम की प्रभावशीलता को सत्यापित किया।
•
Limitations:
◦
चूंकि इन परिणामों का मूल्यांकन एक विशिष्ट चिकित्सा डेटासेट पर किया गया था, इसलिए अन्य डोमेन या डेटासेट पर उनकी सामान्यता निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।
◦
प्रयुक्त निष्पक्षता मीट्रिक (कवरेज या हानि) के अलावा अन्य निष्पक्षता अवधारणाओं की प्रयोज्यता की जांच की जानी चाहिए।
◦
ऑफ़लाइन सुदृढीकरण सीखने की प्रकृति के कारण, वास्तविक वातावरण में प्रदर्शन के लिए अतिरिक्त सत्यापन की आवश्यकता होती है।