दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

मैलवेयर का पता लगाने के लिए GNN स्पष्टीकरणों की संगति पर

Created by
  • Haebom

लेखक

होसैन शोकोहिनेजाद, ग्रिफिन हिगिंस, रूज़बेह रज़ावी-फ़ार, हेसामोदीन मोहम्मदियन, अली ए. घोरबानी

रूपरेखा

यह शोधपत्र नियंत्रण प्रवाह ग्राफ़ (CFG) पर आधारित मैलवेयर पहचान के लिए एक नवीन ढाँचा प्रस्तावित करता है। हम नियम-आधारित एन्कोडिंग और ऑटोएनकोडर-आधारित एम्बेडिंग के संयोजन वाले एक संकर दृष्टिकोण का उपयोग करके CFG नोड विशेषताओं को एम्बेड करते हैं, और दुर्भावनापूर्ण व्यवहार का पता लगाने के लिए GNN-आधारित क्लासिफायर का उपयोग करते हैं। मॉडल की व्याख्यात्मकता बढ़ाने के लिए, हम GNNExplainer, PGExplainer, और CaptumExplainer (एकीकृत ग्रेडिएंट, निर्देशित बैकप्रोपेगेशन और सैलिएंसी का उपयोग करके) लागू करते हैं। हम एक नवीन एकत्रीकरण विधि, रैंकफ़्यूज़न, का उपयोग करके स्पष्टीकरणों की गुणवत्ता भी बढ़ाते हैं। हम लालची एज-वाइज़ कंपोज़िशन (GEC) नामक एक नवीन सबग्राफ़ निष्कर्षण रणनीति भी प्रस्तावित करते हैं, और हम सटीकता, निष्ठा और संगति मेट्रिक्स का उपयोग करके व्यापक मूल्यांकन के माध्यम से प्रस्तावित ढाँचे की प्रभावशीलता को मान्य करते हैं।

Takeaways, Limitations

Takeaways:
नियम-आधारित और शिक्षण-आधारित एम्बेडिंग के संयोजन वाले हाइब्रिड दृष्टिकोण के माध्यम से CFG-आधारित मैलवेयर पहचान प्रदर्शन में सुधार करना।
GNNExplainer, PGExplainer, CaptumExplainer, और RankFusion का उपयोग करके व्याख्या क्षमता में वृद्धि।
नई सबग्राफ निष्कर्षण रणनीति, जीईसी के माध्यम से स्पष्टीकरण की संरचनात्मक स्थिरता में सुधार करना।
सटीकता, निष्ठा और स्थिरता मैट्रिक्स का उपयोग करके कठोर मूल्यांकन के माध्यम से प्रस्तावित ढांचे की प्रभावशीलता का सत्यापन।
Limitations:
विशिष्ट मैलवेयर प्रकारों के लिए संभावित प्रदर्शन पूर्वाग्रह।
नई व्याख्यात्मक तकनीक की सामान्यता निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।
जीईसी की कम्प्यूटेशनल जटिलता पर विचार किया जाना आवश्यक है।
प्रयुक्त डेटासेट की सीमाओं के कारण खराब सामान्यीकरण प्रदर्शन की संभावना।
👍