# Hypnopaedia-Aware Machine Unlearning via Psychometrics of Artificial Mental Imagery

### 저자

Ching-Chun Chang, Kai Gao, Shuying Xu, Anastasia Kordoni, Christopher Leckie, Isao Echizen

### 💡 개요

본 논문은 신경망 백도어 공격의 위협에 대처하기 위한 새로운 사이버 보안 프레임워크를 제안합니다. 최면 학습(hypnopaedia)에 비유되는 백도어 공격을 탐지하고, 심리측정학적 인공 정신 심상 기법을 활용하여 백도어 트리거를 자율적으로 제거하는 '자기 인식 언러닝(self-aware unlearning)' 메커니즘을 개발했습니다. 이를 통해 모델의 지식 충실도를 유지하면서 백도어 취약성을 안정적으로 관리하는 것을 목표로 합니다.

### 🔑 시사점 및 한계

- 백도어 공격의 은밀성을 최면 학습에 비유하여 직관적인 이해를 돕고, 심리측정학적 기법을 활용한 새로운 탐지 및 제거 방법론을 제시합니다.

- 모델 역공학 및 인공 정신 심상을 통해 잠재적 위협을 역으로 추적하고, 확률적 추론으로 백도어 감염 가능성을 정량화하는 접근 방식을 제안합니다.

- 제안된 방법론의 실효성과 다양한 백도어 공격 유형에 대한 일반화 성능 검증이 필요하며, 심상 생성 및 역공학 과정의 계산 비용 및 복잡성 또한 향후 연구 과제로 남아있습니다.

---

[PDF 보기](https://arxiv.org/pdf/2410.05284)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).