Anomagic은 어떠한 이상치 샘플 없이 의미론적으로 일관된 이상치를 생성하는 제로샷 이상치 생성 방법론입니다. 시각적 단서와 텍스트 단서를 교차 모달 프롬프트 인코딩 방식을 통해 통합하여, inpainting 기반 생성 파이프라인을 이끌어냅니다. 이후의 대조적 정제 전략은 합성된 이상치와 마스크 사이의 정확한 정렬을 강화하여, 다운스트림 이상치 탐지 정확도를 향상시킵니다. 훈련을 위해, 13개의 공개 데이터셋에서 수집된 12,987개의 이상치-마스크-캡션 삼중항으로 구성된 AnomVerse를 도입했습니다. AnomVerse의 캡션은 구조화된 시각적 프롬프트와 템플릿 기반 텍스트 힌트를 사용하여 다중 모달 대형 언어 모델에 의해 자동 생성됩니다. 광범위한 실험을 통해, AnomVerse에서 훈련된 Anomagic이 이전 방법보다 더 현실적이고 다양한 이상치를 생성하여 다운스트림 이상치 탐지에서 우수한 성능을 보임을 입증했습니다. 또한, Anomagic은 사용자 정의 프롬프트를 사용하여 모든 정상 범주 이미지에 대한 이상치를 생성할 수 있어, 이상치 생성에 대한 다재다능한 기반 모델을 구축합니다.