Cet article présente un modèle de langage à grande échelle (LLM) en ligne, enrichi par la recherche, permettant de surmonter les limites des méthodes de génération de scénarios existantes dans les tests par simulation, essentiels à la vérification des véhicules autonomes (VA). Grâce à un analyseur de comportement basé sur le LLM, nous déduisons les intentions les plus dangereuses des véhicules en arrière-plan et générons des trajectoires adverses réalisables via des agents LLM supplémentaires. À mesure que de nouvelles intentions sont détectées, nous étendons automatiquement la bibliothèque de comportements des paires intention-planificateur via la mémoire dynamique et le stockage de recherche afin de limiter l'oubli et d'accélérer l'adaptation. Les résultats d'évaluation utilisant le jeu de données Waymo Open Motion démontrent que ce modèle surpasse les méthodes existantes, réduisant le temps de collision minimum moyen de 1,62 s à 1,08 s et diminuant le taux de collision de 75 %.