A Neurosymbolic Framework for Interpretable Cognitive Attack Detection in Augmented Reality
Created by
Haebom
저자
Rongqian Chen, Allison Andreyev, Yanming Xiu, Mahdi Imani, Bin Li, Maria Gorlatova, Gang Tan, Tian Lan
개요
본 논문은 증강현실(AR) 환경에서 인지 공격을 탐지하기 위한 새로운 신경기호 접근 방식인 CADAR을 제시합니다. CADAR은 사전 훈련된 시각-언어 모델(VLM)을 사용하여 다중 모드 시각-언어 입력을 융합하여 기호적 지각 그래프 표현을 얻고, 사전 지식, 중요도 가중치 및 시간적 상관 관계를 통합합니다. 이후 입자 필터 기반의 통계적 추론을 통해 인지 공격을 탐지합니다. 기존의 픽셀 또는 이미지 수준 처리에 국한되고 의미론적 추론 능력이 부족한 시각적 변화에 중점을 둔 방법이나 해석력이 제한적인 블랙박스 접근 방식인 사전 훈련된 VLM에 의존하는 방법들과 달리, CADAR은 사전 훈련된 VLM의 적응성과 입자 필터링의 해석력 및 추론 엄밀성을 결합합니다. 확장된 AR 인지 공격 데이터셋에 대한 실험 결과, 어려운 AR 공격 시나리오에서 기존 최고 성능 모델보다 최대 10.7% 향상된 정확도를 보였습니다.
시사점, 한계점
•
시사점:
◦
신경기호 접근 방식을 사용하여 AR 인지 공격 탐지의 정확성과 해석력을 향상시켰습니다.
◦
사전 훈련된 VLM의 적응성과 입자 필터링의 해석력 및 추론 엄밀성을 성공적으로 결합했습니다.
◦
기존 방법보다 최대 10.7% 향상된 정확도를 달성하여 AR 인지 공격 탐지 분야에 중요한 발전을 제시했습니다.
•
한계점:
◦
제시된 방법의 일반화 성능에 대한 추가적인 연구가 필요합니다. 특정 데이터셋에 대한 성능 향상이 다른 데이터셋에서도 유지될지 확인해야 합니다.
◦
사전 훈련된 VLM에 대한 의존성이 존재하며, 이는 VLM의 한계를 그대로 반영할 수 있습니다.
◦
입자 필터의 계산 비용이 실시간 응용 프로그램에 적합하지 않을 수 있습니다.
◦
다양한 유형의 AR 인지 공격에 대한 탐지 성능을 더욱 심도 있게 평가할 필요가 있습니다.