Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Sur la cohérence des explications du GNN pour la détection des logiciels malveillants

Created by
  • Haebom

Auteur

Hossein Shokouhinejad, Griffin Higgins, Roozbeh Razavi-Far, Hesamodin Mohammadian, Ali A. Ghorbani

Contour

Cet article propose un nouveau cadre pour la détection de logiciels malveillants basé sur les graphes de flux de contrôle (CFG). Nous intégrons les fonctionnalités des nœuds CFG grâce à une approche hybride combinant codage basé sur des règles et intégration basée sur un auto-encodeur, et utilisons un classificateur GNN pour détecter les comportements malveillants. Pour améliorer l'interprétabilité du modèle, nous utilisons GNNExplainer, PGExplainer et CaptumExplainer (utilisant les gradients intégrés, la rétropropagation guidée et la saillance). Nous améliorons également la qualité des explications grâce à une nouvelle méthode d'agrégation, RankFusion. Nous proposons également une nouvelle stratégie d'extraction de sous-graphes appelée Greedy Edge-wise Composition (GEC), et nous validons l'efficacité du cadre proposé par des évaluations complètes utilisant des mesures de précision, de fidélité et de cohérence.

Takeaways, Limitations_

Takeaways:
Amélioration des performances de détection des logiciels malveillants basés sur CFG grâce à une approche hybride combinant des intégrations basées sur des règles et sur l'apprentissage.
Explicabilité améliorée à l'aide de GNNExplainer, PGExplainer, CaptumExplainer et RankFusion.
Améliorer la cohérence structurelle des explications grâce à une nouvelle stratégie d'extraction de sous-graphes, GEC.
Validation de l’efficacité du cadre proposé par une évaluation rigoureuse utilisant des mesures d’exactitude, de fidélité et de cohérence.
Limitations:
Biais de performance potentiel pour des types de logiciels malveillants spécifiques.
Des recherches supplémentaires sont nécessaires pour déterminer la généralisabilité de la nouvelle technique explicative.
Il faut tenir compte de la complexité informatique du GEC.
Possibilité de mauvaises performances de généralisation en raison des limitations de l'ensemble de données utilisé.
👍