Unlocking the Potential of Unlabeled Data in Semi-Supervised Domain Generalization
Created by
Haebom
Category
Empty
저자
Dongkwan Lee, Kyomin Hwang, Nojun Kwak
개요
본 논문은 semi-supervised domain generalization (SSDG) 문제를 다룬다. SSDG는 훈련 및 테스트 데이터의 분포가 다르고, 훈련 중에 소량의 레이블이 지정된 데이터와 다량의 레이블이 지정되지 않은 데이터만 사용 가능한 경우를 말한다. 기존 SSDG 방법들은 모델의 예측이 매우 확신할 수 있는 레이블이 지정되지 않은 샘플(confident-unlabeled samples)만 활용하여 사용 가능한 레이블이 지정되지 않은 데이터를 완전히 활용하지 못한다. 본 논문에서는 기존 SSDG 설정에서 무시되었던 unconfident-unlabeled samples를 통합하는 방법을 최초로 제시한다. 이를 위해, UPCSC (Unlabeled Proxy-based Contrastive learning and Surrogate Class learning)를 제안한다. UPCSC는 두 모듈로 구성된다: 1) Unlabeled Proxy-based Contrastive learning (UPC) 모듈은 unconfident-unlabeled samples를 추가적인 negative pairs로 취급하고, 2) Surrogate Class learning (SC) 모듈은 unconfident-unlabeled samples에 대해 혼란스러운 클래스 집합을 사용하여 positive pairs를 생성한다. 이 모듈들은 plug-and-play 방식이며 도메인 레이블이 필요 없어 기존 접근 방식에 쉽게 통합될 수 있다. 네 가지 널리 사용되는 SSDG 벤치마크에 대한 실험을 통해 제안된 방법이 기준 모델에 추가될 때 성능을 일관되게 향상시키고, 경쟁적인 plug-and-play 방법들을 능가함을 보여준다. 또한, 클래스 수준의 판별력을 향상시키고 도메인 간격을 완화함으로써 SSDG에서 본 방법의 역할을 분석한다. 코드는 https://github.com/dongkwani/UPCSC 에서 이용 가능하다.