[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

One Image is Worth a Thousand Words: A Usability Preservable Text-Image Collaborative Erasing Framework

Created by
  • Haebom

저자

Feiran Li, Qianqian Xu, Shilong Bao, Zhiyong Yang, Xiaochun Cao, Qingming Huang

개요

본 논문은 텍스트-이미지 확산 모델에서 시각적으로 불쾌하거나 유해한 콘텐츠 생성을 방지하기 위한 효과적인 방법으로 최근 등장한 개념 제거(Concept Erasing)에 대한 연구입니다. 기존의 개념 제거 방법들은 수동으로 작성된 텍스트 프롬프트에 크게 의존하여 높은 제거 효율(efficacy)을 달성하면서 다른 무해한 개념에 대한 영향(usability)을 최소화하는 데 어려움이 있었습니다. 본 논문에서는 이러한 한계점을 텍스트와 이미지 모달리티 간의 고유한 차이점으로 설명하고, 이를 해결하기 위해 시각적 지도를 직접적으로 제거 과정에 통합하는 새로운 텍스트-이미지 협업 개념 제거(Co-Erasing) 프레임워크를 제안합니다. Co-Erasing은 텍스트 프롬프트와 프롬프트에 의해 유도된 해당하는 바람직하지 않은 이미지를 통해 개념을 공동으로 설명하고, 음수 지도(negative guidance)를 통해 대상 개념의 생성 확률을 줄입니다. 이 방법은 텍스트와 이미지 간의 지식 차이를 효과적으로 해결하여 제거 효율을 크게 향상시킵니다. 또한, 특정 텍스트 개념과 가장 관련성이 높은 시각적 특징에 모델의 초점을 맞추도록 유도하는 텍스트 기반 이미지 개념 개선 전략을 설계하여 다른 무해한 개념에 대한 방해를 최소화합니다. 포괄적인 실험 결과, Co-Erasing은 효율과 사용성 간의 더 나은 절충점을 제공하며 최첨단 제거 방법보다 훨씬 우수한 성능을 보여줍니다. 코드는 https://github.com/Ferry-Li/Co-Erasing 에서 확인할 수 있습니다.

시사점, 한계점

시사점:
텍스트와 이미지 모달리티 간의 차이를 극복하여 개념 제거의 효율성을 크게 향상시킨 새로운 Co-Erasing 프레임워크 제시.
텍스트 기반 이미지 개념 개선 전략을 통해 무해한 개념에 대한 영향을 최소화.
최첨단 기법보다 효율성과 사용성 측면에서 우수한 성능을 입증.
공개된 코드를 통해 재현성 및 추가 연구 가능성 확보.
한계점:
제안된 프레임워크의 일반화 성능에 대한 추가적인 검증 필요.
다양한 유형의 유해 콘텐츠에 대한 Co-Erasing의 로버스트성 평가 필요.
특정 유형의 이미지나 개념에 편향될 가능성에 대한 분석 필요.
👍