본 논문은 Stable Diffusion과 같이 확산 기반 생성 모델의 확장에 중요한 역할을 하는 변분 오토인코더(VAE)의 강건성에 대한 문제를 다룹니다. 기존에는 성능과 강건성 사이의 상충 관계로 인해 생성 모델에 대한 적대적 훈련이 성능 저하를 야기할 것이라는 우려 때문에 간과되었으나, 본 논문에서는 이러한 가정에 도전합니다. Smooth Robust Latent VAE (SRL-VAE)라는 새로운 적대적 훈련 프레임워크를 제시하여 생성 품질과 강건성을 동시에 향상시킵니다. 기존의 적대적 훈련과 달리, SRL-VAE는 적대적 섭동을 통해 잠재 공간을 부드럽게 하여 더 일반화 가능한 표현을 촉진하고, 원본 충실도를 유지하기 위해 독창성 표현으로 규제합니다. 사전 훈련된 VAE에 사후 훈련 단계로 적용되어 최소한의 계산 오버헤드로 이미지 강건성과 충실도를 향상시킵니다. 실험 결과, SRL-VAE는 이미지 재구성 및 텍스트 기반 이미지 편집에서 생성 품질과 Nightshade 공격 및 이미지 편집 공격에 대한 강건성을 모두 향상시키는 것으로 나타났습니다. 이는 적대적 훈련이 생성 모델에 해롭다는 기존의 생각을 뒤엎고, 충실도와 강건성을 모두 향상시킬 수 있음을 보여주는 새로운 패러다임을 제시합니다.