Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Influence Functions for Scalable Data Attribution in Diffusion Models

Created by
  • Haebom

저자

Bruno Mlodozeniec, Runa Eschenhagen, Juhan Bae, Alexander Immer, David Krueger, Richard Turner

개요

본 논문은 확산 모델의 데이터 귀속 및 해석성 문제 해결을 위해 영향 함수 프레임워크를 개발합니다. 기존의 지도 학습에서 영향 함수는 특정 데이터 제거 시 손실 변화 예측에 사용되었지만, 본 논문은 확산 모델에서 특정 예시 생성 확률 변화를 여러 근사 측정값을 통해 예측하는 데 초점을 맞춥니다. 여러 근사 측정값을 이용하여 영향 함수를 공식화하고, 기존 방법들을 본 프레임워크 내 특정 설계 선택으로 해석합니다. 계산 효율을 위해 확산 모델에 특화된 일반화된 Gauss-Newton 행렬 기반 K-FAC 근사를 체계적으로 개발하며, 기존 방법들을 본 프레임워크의 특정 설계 선택으로 재구성합니다. 제안된 방법이 Linear Data-modelling Score (LDS)나 상위 영향 제거 재훈련과 같은 일반적인 평가에서 기존 데이터 귀속 방법보다 우수한 성능을 보이며, 방법 특유의 하이퍼파라미터 조정이 필요 없음을 보여줍니다.

시사점, 한계점

시사점:
확산 모델의 데이터 귀속 및 해석성 문제에 대한 새로운 접근 방식 제시
기존 방법들을 통합하는 일반적인 영향 함수 프레임워크 제공
확산 모델에 최적화된 K-FAC 근사를 통한 계산 효율성 향상
제안된 방법의 우수한 성능 검증 (LDS, 상위 영향 제거 재훈련)
방법 특유의 하이퍼파라미터 조정 불필요
한계점:
K-FAC 근사의 정확도 및 일반화 성능에 대한 추가적인 연구 필요
다양한 유형의 확산 모델에 대한 일반화 가능성 검증 필요
실제 응용 분야에서의 성능 평가 및 적용 사례 연구 필요
👍