दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

विस्तारित हिस्टोग्राम-आधारित आउटलायर स्कोर (EHBOS)

Created by
  • Haebom

लेखक

तनवीर इस्लाम

रूपरेखा

हिस्टोग्राम-आधारित आउटलियर स्कोर (HBOS) अपनी गणनात्मक दक्षता और सरलता के कारण व्यापक रूप से प्रयुक्त आउटलियर पहचान विधि है। हालाँकि, चूँकि यह विशेषताओं के बीच स्वतंत्रता मानता है, इसलिए उन डेटासेट में आउटलियर पहचान करने की इसकी क्षमता सीमित है जहाँ विशेषताओं की परस्पर क्रियाएँ महत्वपूर्ण होती हैं। इस पत्र में, हम विस्तारित हिस्टोग्राम-आधारित आउटलियर स्कोर (EHBOS) का प्रस्ताव करते हैं, जो HBOS का एक उन्नत रूप है जो विशेषता युग्मों के बीच निर्भरताओं को दर्शाने के लिए द्वि-आयामी हिस्टोग्राम को सम्मिलित करता है। यह विस्तार EHBOS को प्रासंगिक और निर्भरता-आधारित विसंगतियों की पहचान करने में सक्षम बनाता है जिनका पता लगाने में HBOS विफल रहता है। 17 बेंचमार्क डेटासेट का उपयोग करते हुए, हम विभिन्न विसंगति पहचान परिदृश्यों में EHBOS की प्रभावशीलता और मजबूती का मूल्यांकन करते हैं। EHBOS कई डेटासेट पर HBOS से बेहतर प्रदर्शन करता है जहाँ विसंगति संरचना को परिभाषित करने के लिए विशेषताओं की परस्पर क्रियाएँ महत्वपूर्ण होती हैं, जिससे ROC AUC में उल्लेखनीय सुधार होता है। ये परिणाम प्रदर्शित करते हैं कि जटिल विशेषता निर्भरताओं के मॉडलिंग के लिए EHBOS, HBOS का एक मूल्यवान विस्तार हो सकता है। विशेषकर ऐसे डेटासेट में जहां प्रासंगिक या संबंधपरक विसंगतियां महत्वपूर्ण भूमिका निभाती हैं, EHBOS एक शक्तिशाली नया विसंगति पहचान उपकरण प्रदान करता है।

Takeaways, Limitations

Takeaways:
हम एक EHBOS एल्गोरिथ्म का प्रस्ताव करते हैं जो सुविधाओं के बीच परस्पर निर्भरता पर विचार करके मौजूदा HBOS की सीमाओं पर काबू पाता है।
विभिन्न विसंगति पहचान परिदृश्यों में EHBOS की प्रभावशीलता और मजबूती का प्रयोगात्मक सत्यापन करना।
हमने उन डेटासेटों पर HBOS की तुलना में बेहतर प्रदर्शन और ROC AUC देखा जहां फीचर इंटरैक्शन महत्वपूर्ण हैं।
स्थितिजन्य या संबंधपरक आउटलायर्स का पता लगाने के लिए उपयोगी एक नया उपकरण प्रदान करता है।
Limitations:
उच्च-आयामी डेटासेट के लिए मापनीयता और गणना लागत में संभावित वृद्धि (द्वि-आयामी हिस्टोग्राम के उपयोग के कारण)
इष्टतम हिस्टोग्राम बिन आकार निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।
विभिन्न प्रकार के आउटलाइअर पैटर्न के लिए सामान्यीकरण प्रदर्शन का मूल्यांकन करने की आवश्यकता
👍