Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

DIAGen: Semantically Diverse Image Augmentation with Generative Models for Few-Shot Learning

Created by
  • Haebom

저자

Tobias Lingenberg, Markus Reuter, Gopika Sudhakaran, Dominik Gojny, Stefan Roth, Simone Schaub-Meyer

개요

DIAGen은 기존의 간단한 데이터 증강 기법(회전, 뒤집기 등)의 한계를 극복하기 위해 제안된 새로운 데이터 증강 방법입니다. 기존 방법들이 고차원 의미적 속성 변화에 제한적이라는 점을 지적하며, Textual Inversion을 이용한 객체 임베딩에 Gaussian noise를 적용하고, text-to-text 생성 모델의 지식을 활용하여 diffusion model의 이미지 생성을 유도합니다. 또한, 품질이 낮은 생성 샘플의 영향을 완화하기 위한 가중치 메커니즘을 도입했습니다. 다양한 데이터셋에 대한 실험 결과, DIAGen은 의미적 다양성을 향상시키고 분류기 성능을 개선하며, 특히 out-of-distribution 샘플에서 기존 방법들보다 우수한 성능을 보였습니다. DA-Fusion을 기반으로 하여, 다양한 시점, 환경, 날씨 조건 또는 품종과 같은 클래스 수준의 의미적 속성 변화를 가능하게 합니다.

시사점, 한계점

시사점:
기존 데이터 증강 기법의 한계(고차원 의미적 속성 변화 부족)를 극복하는 새로운 방법 제시.
Textual Inversion과 text-to-text 모델을 활용하여 의미적 다양성과 데이터 품질 향상.
Out-of-distribution 샘플에 대한 성능 향상.
분류기 성능 개선.
한계점:
제안된 가중치 메커니즘의 구체적인 설계 및 효과에 대한 자세한 설명 부족.
다양한 데이터셋에서의 성능 비교는 있으나, 특정 데이터셋에 대한 과적합 가능성에 대한 분석 부족.
계산 비용 증가 가능성.
👍