Limitations of Using Identical Distributions for Training and Testing When Learning Boolean Functions
Created by
Haebom
Category
Empty
저자
Jordi Perez-Guijarro
개요
훈련 데이터와 테스트 데이터의 분포가 일치하지 않을 때 일반화 문제를 이해하는 것은 더욱 복잡해진다. 이 논문은 훈련 데이터의 분포가 테스트 데이터의 분포와 동일한 것이 항상 최적인가라는 근본적인 질문에 초점을 맞춘다. 일방향 함수의 존재를 가정할 때, 저자들은 답이 '아니오'임을 발견했다. 즉, 분포 일치는 항상 최선은 아니라는 것이다. 그러나 특정 규칙성이 대상 함수에 적용될 경우, 균등 분포의 경우 표준 결론이 회복됨을 보여준다.
시사점, 한계점
•
분포 일치가 항상 최선이 아닐 수 있다는 것을 보여줌으로써, 일반화에 대한 기존의 이해에 도전한다.