Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

ACE and Diverse Generalization via Selective Disagreement

Created by
  • Haebom

저자

Oliver Daniels, Stuart Armstrong, Alexandre Maranhao, Mahirah Fairuz Rahman, Benjamin M. Marlin, Rebecca Gorman

개요

본 논문은 심층 신경망이 가짜 상관관계(spurious correlations)에 취약하다는 문제를 해결하기 위한 새로운 방법인 ACE를 제안합니다. 기존 연구는 불완전한 가짜 상관관계에 초점을 맞춰 상관관계를 깨는 레이블된 인스턴스에 접근하는 방식을 사용했지만, 완전한 가짜 상관관계의 경우 올바른 일반화가 근본적으로 불충분하게 특정됩니다. ACE는 훈련 데이터와 일치하지만 새로운 레이블되지 않은 입력의 하위 집합에 대해 서로 다른 예측을 하는 개념 집합을 학습하여 이러한 불충분한 특정 문제를 해결합니다. 자신감 있고 선택적인 불일치를 장려하는 자기 훈련 방식을 사용하여 ACE는 다양한 완전한 가짜 상관관계 벤치마크에서 기존 방법과 동등하거나 우수한 성능을 보이며, 불완전한 가짜 상관관계에도 강합니다. 또한, ACE는 기존 방법보다 구성이 용이하여 사전 지식을 직접적으로 인코딩하고 원칙에 기반한 비지도 모델 선택이 가능합니다. 언어 모델 정렬에 대한 초기 적용에서 ACE는 신뢰할 수 없는 측정값에 접근하지 않고도 측정 조작 감지 벤치마크에서 경쟁력 있는 성능을 달성했습니다.

시사점, 한계점

시사점:
완전한 가짜 상관관계 문제에 대한 새로운 해결책 제시 (ACE 알고리즘).
기존 방법보다 우수하거나 동등한 성능을 다양한 벤치마크에서 달성.
불완전한 가짜 상관관계에도 강건함.
사전 지식 인코딩 및 비지도 모델 선택 가능.
언어 모델 정렬 분야에서 신뢰할 수 없는 측정값 없이도 경쟁력 있는 성능 달성.
한계점:
여전히 중요한 한계점 존재 (구체적인 한계점은 논문에서 명시적으로 언급되지 않음).
👍