Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Sobre la consistencia de las explicaciones de GNN para la detección de malware

Created by
  • Haebom

Autor

Hossein Shokouhinejad, Griffin Higgins, Roozbeh Razavi-Far, Hesamodin Mohammadian, Ali A. Ghorbani

Describir

Este artículo propone un nuevo marco para la detección de malware basado en grafos de flujo de control (GFC). Incorporamos las características de los nodos GFC mediante un enfoque híbrido que combina codificación basada en reglas e incrustación basada en autocodificadores, y utilizamos un clasificador basado en GNN para detectar comportamiento malicioso. Para mejorar la interpretabilidad del modelo, aplicamos GNNExplainer, PGExplainer y CaptumExplainer (utilizando gradientes integrados, retropropagación guiada y saliencia). También mejoramos la calidad de las explicaciones mediante un novedoso método de agregación, RankFusion. Asimismo, proponemos una novedosa estrategia de extracción de subgrafos denominada Greedy Edge-wise Composition (GEC), y validamos la eficacia del marco propuesto mediante evaluaciones exhaustivas utilizando métricas de precisión, fidelidad y consistencia.

Takeaways, Limitations

Takeaways:
Mejora del rendimiento de detección de malware basada en CFG a través de un enfoque híbrido que combina incrustaciones basadas en reglas y basadas en aprendizaje.
Explicabilidad mejorada utilizando GNNExplainer, PGExplainer, CaptumExplainer y RankFusion.
Mejorar la consistencia estructural de las explicaciones a través de una nueva estrategia de extracción de subgrafos, GEC.
Validación de la eficacia del marco propuesto mediante una evaluación rigurosa utilizando métricas de precisión, fidelidad y consistencia.
Limitations:
Posible sesgo de rendimiento para tipos específicos de malware.
Se necesitan más investigaciones para determinar la generalización de la nueva técnica explicativa.
Es necesario tener en cuenta la complejidad computacional del GEC.
Posibilidad de un rendimiento de generalización deficiente debido a las limitaciones del conjunto de datos utilizado.
👍