Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

A Flat Minima Perspective on Understanding Augmentations and Model Robustness

Created by
  • Haebom
Category
Empty

저자

Weebum Yoo, Sung Whan Yoon

개요

모델 견고성은 데이터 손상, 적대적 공격, 도메인 이동을 포함한 예측하지 못한 분포 변화에 대한 모델의 일반화 능력을 의미합니다. 데이터 증강은 견고성을 향상시키는 보편적이고 효과적인 방법 중 하나입니다. 다양한 분야에서 증강의 큰 성공에도 불구하고, 모델 견고성 개선에 대한 효과에 대한 일반적인 이론적 이해가 부족합니다. 본 연구는 손실 표면 평탄도와 PAC 일반화 경계라는 관점에서 증강이 어떻게 모델 견고성을 향상시킬 수 있는지 설명하기 위한 통합 이론적 프레임워크를 제공합니다. 본 연구는 i) 기존 증강 방법의 대부분을 광범위하게 포괄하고, ii) 적대적 공격과 같은 특정 유형의 분포 변화에 국한되지 않는다는 점에서 이전 연구와 차별화됩니다. CIFAR 및 ImageNet 데이터 세트를 기반으로 하는 기존의 일반적인 손상 및 적대적 견고성 벤치마크, PACS 및 OfficeHome을 포함한 도메인 일반화 벤치마크에 대한 시뮬레이션을 통해 이론을 확인합니다.

시사점, 한계점

모델 견고성을 향상시키기 위한 데이터 증강의 효과에 대한 이론적 프레임워크 제공
기존 증강 방법의 대부분을 포괄하는 광범위한 분석
적대적 공격과 같은 특정 유형의 분포 변화에 국한되지 않는 분석
CIFAR, ImageNet, PACS, OfficeHome 데이터 세트를 사용한 시뮬레이션을 통해 이론 검증
구체적인 한계점은 제시되지 않음 (논문 요약에서 언급되지 않음)
👍