DIAGen은 기존의 간단한 데이터 증강 기법(회전, 뒤집기 등)의 한계를 극복하기 위해 제안된 새로운 데이터 증강 방법입니다. 기존 방법들이 고차원 의미적 속성 변화에 제한적이라는 점을 지적하며, Textual Inversion을 이용한 객체 임베딩에 Gaussian noise를 적용하고, text-to-text 생성 모델의 지식을 활용하여 diffusion model의 이미지 생성을 유도합니다. 또한, 품질이 낮은 생성 샘플의 영향을 완화하기 위한 가중치 메커니즘을 도입했습니다. 다양한 데이터셋에 대한 실험 결과, DIAGen은 의미적 다양성을 향상시키고 분류기 성능을 개선하며, 특히 out-of-distribution 샘플에서 기존 방법들보다 우수한 성능을 보였습니다. DA-Fusion을 기반으로 하여, 다양한 시점, 환경, 날씨 조건 또는 품종과 같은 클래스 수준의 의미적 속성 변화를 가능하게 합니다.