본 논문은 보안 검사를 위한 X-ray 금지 품목 자동 탐지를 다루며, 실제 검사 환경에서 사용되는 다중 뷰 이미지를 활용하는 새로운 접근 방식을 제시한다. 기존 연구가 시각 정보에만 의존하거나 단일 뷰 이미지와 언어 정보를 결합하는 데 초점을 맞춘 반면, 본 연구는 두 번째 뷰가 언어와 유사한 제약 조건을 제공할 수 있다는 가설을 세운다. 이를 위해 다중 뷰 및 다중 모달리티를 지원하는 최초의 X-ray 검사 벤치마크인 DualXrayBench를 제안하고, 이를 기반으로 기하학적 (교차 뷰) - 의미적 (교차 모달리티) 리즈너 (GSR)를 개발하여 획기적인 성능 향상을 달성했다.