Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

D-GAP: Improving Out-of-Domain Robustness via Dataset-Agnostic and Gradient-Guided Augmentation in Amplitude and Pixel Spaces

Created by
  • Haebom
Category
Empty

저자

Ruoqi Wang, Haitao Wang, Shaojie Guo, Qiong Luo

개요

실제 컴퓨터 비전 응용 분야에서 이미지 배경, 스타일 및 획득 도구의 변화로 인해 모델 성능이 저하되는 상황에서, OOD (Out-of-Domain) 강건성을 확보하는 것은 어려운 과제입니다. D-GAP (Dataset-agnostic and Gradient-guided augmentation in Amplitude and Pixel spaces)는 주파수 공간과 픽셀 공간에서 목표 기반 증강을 도입하여 OOD 강건성을 향상시키는 방법을 제안합니다. D-GAP는 태스크 그래디언트로부터 주파수 공간에서 민감도 맵을 계산하여 모델이 서로 다른 주파수 구성 요소에 얼마나 강력하게 반응하는지 파악하고, 이를 통해 소스 및 타겟 샘플 간의 진폭을 적응적으로 보간합니다. 이를 통해 주파수 공간의 학습 편향을 줄이고, 보완적인 픽셀 공간 블렌딩 절차를 통해 세밀한 공간 세부 정보를 복원합니다. 네 개의 실제 데이터 세트와 세 개의 도메인 적응 벤치마크에 대한 광범위한 실험을 통해 D-GAP는 일반 및 데이터 세트별 증강 모두를 지속적으로 능가하며, 실제 데이터 세트에서 평균 OOD 성능을 +5.3%, 벤치마크 데이터 세트에서 +1.8% 향상시켰습니다.

시사점, 한계점

시사점:
D-GAP는 데이터 세트 특정 지식 없이도 OOD 강건성을 향상시킬 수 있는 새로운 증강 기법을 제시합니다.
주파수 공간에서의 민감도 맵 기반 증강은 모델의 학습 편향을 효과적으로 줄여줍니다.
픽셀 공간 블렌딩은 세밀한 공간적 디테일을 보존하여 성능 향상에 기여합니다.
다양한 실제 데이터 세트 및 벤치마크에서 뛰어난 성능을 입증하여 방법론의 유효성을 보여줍니다.
한계점:
주파수 공간에서의 계산 및 민감도 맵 생성에 필요한 계산 비용이 있을 수 있습니다.
주파수 공간 증강 및 픽셀 공간 블렌딩의 적절한 균형을 찾는 것이 중요할 수 있습니다.
제안된 방법이 다른 도메인 적응 문제에 얼마나 일반화될 수 있는지 추가 연구가 필요합니다.
👍