# Whispers in the Noise: Surrogate-Guided Concept Awakening via a Multi-Agent Framework

### 저자

Mengyu Sun, Ziyuan Yang, Zunlong Zhou, Junxu Liu, Haibo Hu, Yi Zhang

### 💡 개요

본 논문은 확산 모델(Diffusion Models, DMs)에서 삭제된 개념(concept erasure)을 복원하는 '개념 각성(concept awakening)' 문제를 다룹니다. 기존의 개념 삭제 방식이 완전히 개념을 제거하지 못하고, 특히 블랙박스 환경에서의 개념 각성 방법이 부족하다는 점에 주목하여, 논문은 다중 에이전트 프레임워크인 ConceptAgent를 제안합니다. ConceptAgent는 잡음 상태의 초기화를 조절함으로써 모델 파라미터 없이도 삭제된 개념을 효과적으로 복원할 수 있음을 보입니다.

### 🔑 시사점 및 한계

- 기존의 개념 삭제 기법이 확산 모델의 초기 노이즈 제거 단계에서 개념 정보를 완전히 제거하지 못하며, 후반 단계로 갈수록 텍스트 조건보다 내부 노이즈 상태에 의존하게 되는 특성을 분석했습니다.

- 블랙박스 환경에서도 모델 파라미터, 그래디언트, 내부 표현에 접근하지 않고도 개념 각성을 달성할 수 있는 새로운 다중 에이전트 프레임워크(ConceptAgent)를 제안하여 실질적인 위협 가능성을 보여줍니다.

- 제안된 방법론은 개념 삭제의 근본적인 한계를 드러내고, 확산 모델의 의미론적 제어 동역학에 대한 새로운 이해를 제공합니다.

---

[PDF 보기](https://arxiv.org/pdf/2605.18150)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).
