Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Unlocking the Potential of Unlabeled Data in Semi-Supervised Domain Generalization

Created by
  • Haebom
Category
Empty

저자

Dongkwan Lee, Kyomin Hwang, Nojun Kwak

개요

본 논문은 semi-supervised domain generalization (SSDG) 문제를 다룬다. SSDG는 훈련 및 테스트 데이터의 분포가 다르고, 훈련 중에 소량의 레이블이 지정된 데이터와 다량의 레이블이 지정되지 않은 데이터만 사용 가능한 경우를 말한다. 기존 SSDG 방법들은 모델의 예측이 매우 확신할 수 있는 레이블이 지정되지 않은 샘플(confident-unlabeled samples)만 활용하여 사용 가능한 레이블이 지정되지 않은 데이터를 완전히 활용하지 못한다. 본 논문에서는 기존 SSDG 설정에서 무시되었던 unconfident-unlabeled samples를 통합하는 방법을 최초로 제시한다. 이를 위해, UPCSC (Unlabeled Proxy-based Contrastive learning and Surrogate Class learning)를 제안한다. UPCSC는 두 모듈로 구성된다: 1) Unlabeled Proxy-based Contrastive learning (UPC) 모듈은 unconfident-unlabeled samples를 추가적인 negative pairs로 취급하고, 2) Surrogate Class learning (SC) 모듈은 unconfident-unlabeled samples에 대해 혼란스러운 클래스 집합을 사용하여 positive pairs를 생성한다. 이 모듈들은 plug-and-play 방식이며 도메인 레이블이 필요 없어 기존 접근 방식에 쉽게 통합될 수 있다. 네 가지 널리 사용되는 SSDG 벤치마크에 대한 실험을 통해 제안된 방법이 기준 모델에 추가될 때 성능을 일관되게 향상시키고, 경쟁적인 plug-and-play 방법들을 능가함을 보여준다. 또한, 클래스 수준의 판별력을 향상시키고 도메인 간격을 완화함으로써 SSDG에서 본 방법의 역할을 분석한다. 코드는 https://github.com/dongkwani/UPCSC 에서 이용 가능하다.

시사점, 한계점

시사점:
기존 SSDG 방법의 한계를 극복하고 unconfident-unlabeled samples를 효과적으로 활용하는 새로운 방법(UPCSC) 제시.
UPCSC는 plug-and-play 방식으로 기존 SSDG 모델에 쉽게 통합 가능.
다양한 SSDG 벤치마크에서 기존 방법 대비 성능 향상을 실험적으로 검증.
클래스 수준의 판별력 향상 및 도메인 간격 완화 효과 확인.
한계점:
제안된 방법의 성능 향상이 특정 벤치마크나 데이터셋에 국한될 가능성 존재.
UPCSC의 두 모듈(UPC, SC)의 하이퍼파라미터 최적화에 대한 추가적인 연구 필요.
더욱 다양하고 복잡한 실제 세계 SSDG 문제에 대한 성능 평가 필요.
👍