ACE and Diverse Generalization via Selective Disagreement
Created by
Haebom
저자
Oliver Daniels, Stuart Armstrong, Alexandre Maranhao, Mahirah Fairuz Rahman, Benjamin M. Marlin, Rebecca Gorman
개요
본 논문은 심층 신경망이 가짜 상관관계(spurious correlations)에 취약하다는 문제를 해결하기 위한 새로운 방법인 ACE를 제안합니다. 기존 연구는 불완전한 가짜 상관관계에 초점을 맞춰 상관관계를 깨는 레이블된 인스턴스에 접근하는 방식을 사용했지만, 완전한 가짜 상관관계의 경우 올바른 일반화가 근본적으로 불충분하게 특정됩니다. ACE는 훈련 데이터와 일치하지만 새로운 레이블되지 않은 입력의 하위 집합에 대해 서로 다른 예측을 하는 개념 집합을 학습하여 이러한 불충분한 특정 문제를 해결합니다. 자신감 있고 선택적인 불일치를 장려하는 자기 훈련 방식을 사용하여 ACE는 다양한 완전한 가짜 상관관계 벤치마크에서 기존 방법과 동등하거나 우수한 성능을 보이며, 불완전한 가짜 상관관계에도 강합니다. 또한, ACE는 기존 방법보다 구성이 용이하여 사전 지식을 직접적으로 인코딩하고 원칙에 기반한 비지도 모델 선택이 가능합니다. 언어 모델 정렬에 대한 초기 적용에서 ACE는 신뢰할 수 없는 측정값에 접근하지 않고도 측정 조작 감지 벤치마크에서 경쟁력 있는 성능을 달성했습니다.