Cet article présente CADAR, une nouvelle approche neurosymbolique pour la détection des attaques cognitives en réalité augmentée (RA). CADAR utilise un modèle de langage visuel (MLV) pré-entraîné pour fusionner des entrées multimodales de langage visuel afin d'obtenir une représentation graphique perceptive symbolique, intégrant les connaissances préalables, les pondérations d'importance et les corrélations temporelles. Il détecte ensuite les attaques cognitives grâce à une inférence statistique basée sur un filtre particulaire. Contrairement aux méthodes existantes qui se concentrent sur les variations visuelles, qui se limitent au traitement au niveau du pixel ou de l'image et manquent de capacités d'inférence sémantique, ou qui s'appuient sur des MLV pré-entraînés, qui sont des approches boîte noire à l'interprétabilité limitée, CADAR combine l'adaptabilité des MLV pré-entraînés avec l'interprétabilité et la rigueur d'inférence du filtrage particulaire. Les résultats expérimentaux sur un ensemble étendu de données d'attaques cognitives en RA démontrent une précision jusqu'à 10,7 % supérieure à celle des modèles de pointe existants dans des scénarios d'attaque en RA complexes.