Taeckyung Lee, Sorn Chottananurak, Junsu Kim, Jinwoo Shin, Taesik Gong, Sung-Ju Lee
개요
본 논문은 훈련 데이터와 테스트 데이터 간의 도메인 차이로 인해 성능이 저하되는 심층 학습 모델의 문제를 해결하기 위해, 테스트 시간 적응(TTA) 기법을 제시합니다. 기존 TTA 방법들은 심각한 도메인 차이에 취약하고, 최근 활성 TTA 접근 방식은 높은 레이블링 비용으로 인해 실용적이지 못합니다. 이를 해결하기 위해, 본 논문에서는 이진 피드백을 사용하는 새로운 TTA 설정을 제안합니다. 이진 피드백은 어노테이터로부터 모델 예측의 정확성 여부에 대한 간단한 피드백을 받는 방식으로 레이블링 부담을 크게 줄입니다. 이 설정 하에서, 본 논문은 불확실한 샘플에 대한 이진 피드백 기반 적응과 자신있는 예측에 대한 합의 기반 자기 적응을 강화 학습을 통해 균형 있게 조정하는 새로운 이중 경로 최적화 프레임워크인 BiTTA를 제안합니다. 실험 결과, BiTTA는 최첨단 기준 모델보다 13.3%p의 정확도 향상을 달성하여 최소한의 레이블링 노력으로 심각한 분포 변화를 처리하는 효과를 보여줍니다. 소스 코드는 https://github.com/taeckyung/BiTTA 에서 확인할 수 있습니다.