본 논문은 텍스트-이미지(T2I) 모델의 윤리적 문제를 해결하기 위해, 공정하고 안전한 콘텐츠 생성을 위한 포괄적인 제어 기법을 제안한다. 기존 기법들은 개별적인 책임 개념만을 다루고 해석력이 부족하며 모델 성능 저하를 야기하는 한계를 지닌다. 본 연구는 외부 플러그 앤 플레이 메커니즘을 활용하여 다양한 개념들을 동시에 고려하는 해석 가능한 통합 책임 공간을 학습하는 독창적인 기법을 제시한다. 지식 증류와 개념 표백을 사용하여 목표 T2I 파이프라인에 플러그인 방식으로 적용하며, 텍스트 임베딩 공간과 확산 모델 잠재 공간 두 지점에 모듈을 개발하여 효과를 입증한다.