본 논문은 합성곱 신경망(CNN)의 적대적 공격에 대한 취약성을 해결하기 위해, CNN 활성화의 엔트로피를 모니터링하는 새로운 방법을 제시합니다. 기존의 적대적 공격 탐지 방법들이 모델 재훈련, 네트워크 구조 수정, 또는 정상 입력에 대한 성능 저하 등의 단점을 가지는 것과 달리, 본 논문에서 제시하는 방법은 모델 수정 없이 활성화 엔트로피의 변화를 감지하여 적대적 입력을 탐지합니다. VGG-16을 사용한 실험 결과, 적대적 입력은 초기 합성곱 계층에서 활성화 엔트로피를 7% 가량 일관되게 변화시키며, 이를 통해 90%의 탐지 정확도를 달성하고, 위양성 및 위음성 비율을 20% 미만으로 유지하는 것을 보여줍니다. 이는 CNN이 활성화 패턴에 분포 변화를 내재적으로 인코딩하고 있음을 보여주는 결과이며, 활성화 엔트로피만으로 CNN의 신뢰성을 평가할 수 있음을 시사합니다. 따라서 본 연구는 모델 성능 저하 없이 실시간으로 적대적 입력을 탐지하는 자가 진단 비전 시스템의 실용적인 배포를 가능하게 합니다.