Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Chimera : Exploiter les LLM multi-agents pour la simulation automatique des menaces internes

Created by
  • Haebom

Auteur

Jiongchi Yu, Xiaofei Xie, Qiang Hu, Yuhan Ma, Ziming Zhao

Contour

Cet article propose Chimera, un framework multi-agents basé sur un modèle de langage à grande échelle (LLM), pour pallier le manque de données dans le domaine de la détection des menaces internes (ITD). Chimera simule automatiquement les activités internes, bénignes et malveillantes, dans divers environnements d'entreprise et collecte divers journaux pour générer un nouvel ensemble de données, ChimeraLog. Chimera modélise chaque employé comme un agent doté d'un comportement spécifique à son rôle et intègre des réunions de groupe, des interactions bidirectionnelles et des modules de planification autonome pour capturer une dynamique organisationnelle réaliste. L'ensemble de données ChimeraLog, qui comprend 15 types d'attaques internes, a été créé en simulant des activités dans trois domaines sensibles : les entreprises technologiques, les sociétés financières et les établissements de santé. Des études humaines et des analyses quantitatives ont validé la diversité, le réalisme et la présence de modèles de menaces explicables de ChimeraLog. L'évaluation des méthodologies ITD existantes a révélé un score F1 moyen de 0,83 pour ChimeraLog, significativement inférieur au score de 0,99 pour l'ensemble de données CERT, démontrant la grande difficulté de ChimeraLog et son utilité pour faire avancer la recherche ITD.

Takeaways, Limitations

Takeaways:
Nous présentons la possibilité de générer un ensemble de données de menaces internes réalistes grâce à une simulation multi-agents basée sur LLM.
L'ensemble de données ChimeraLog présente un niveau de difficulté plus élevé que les ensembles de données existants et contribue à l'avancement de la recherche ITD.
Mettez en œuvre des scénarios réalistes qui reflètent divers environnements d’entreprise et types d’attaques internes.
Aide à améliorer l’interprétabilité des modèles ITD en incluant des modèles de menaces explicables.
Limitations:
Manque de description détaillée du processus de création et des paramètres de l'ensemble de données ChimeraLog.
Des vérifications supplémentaires sont nécessaires pour garantir une adéquation parfaite avec l’environnement commercial réel.
Risque que les données soient biaisées en faveur d’environnements d’entreprise spécifiques.
Il est peu probable qu’il couvre tous les types d’attaques internes.
👍