Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Perturbative partial moment matching and gradient-flow adaptive importance sampling transformations for Bayesian leave one out cross-validation

Created by
  • Haebom

저자

Joshua C Chang, Xiangting Li, Shixin Xu, Hao-Ren Yao, Julia Porcino, Carson Chow

개요

본 논문은 베이지안 모델에서 leave-one-out (LOO) 교차 검증을 재적합 없이 근사하는 중요도 샘플링(IS) 방법을 제안합니다. 베이지안 업데이트 방정식을 반전하여 모델 사후 분포에서 특정 데이터 포인트를 제거함으로써 각 데이터 포인트에 대한 LOO 사후 분포 하에서의 기댓값을 전체 데이터 사후 분포에 대한 가중 평균으로 계산합니다. 이 과정에서 가중치 안정화를 위해 변환을 통한 사후 분포 적응이 필요할 수 있으며, 적절한 변환을 찾는다면 재적합을 피할 수 있습니다. 이를 위해, $T(\boldsymbol{\theta})=\boldsymbol{\theta} + h Q(\boldsymbol{\theta})$ 형태의 전단사적(bijective) 섭동 변환을 사용하고, 1) 부분 모멘트 매칭과 2) 기울기 흐름 진화라는 두 가지 변환 방법을 제시합니다. 부분 모멘트 매칭은 LOO를 위한 적응이 전체 데이터 사후 분포에 대한 작은 섭동임을 인식하여 기존의 모멘트 매칭 연구를 확장한 것이고, 기울기 흐름 변환은 IS 추정량의 분산과 변환된 분포와 LOO fold 통계량 간의 KL 발산 등 다양한 통계적 목표를 완화하여 정의됩니다. 모델 특정적인 기울기 흐름 변환은 Jacobian 행렬식을 계산해야 하지만, 자동 미분을 통해 쉽게 구할 수 있으며, 로지스틱 회귀와 얕은 ReLU 활성화 신경망의 경우에는 닫힌 형태의 표현식을 유도했습니다. $n\ll p$인 불안정한 LOO IS 가중치를 생성하는 것으로 알려진 데이터셋을 사용하여 방법론을 테스트했습니다.

시사점, 한계점

시사점: 베이지안 모델에서 LOO 교차 검증을 효율적으로 수행하는 새로운 방법을 제시합니다. 재적합 없이 LOO를 근사하여 계산 비용을 절감할 수 있습니다. 부분 모멘트 매칭과 기울기 흐름 진화라는 두 가지 새로운 변환 방법을 제안하여 가중치 안정화 문제를 해결합니다. 로지스틱 회귀와 얕은 ReLU 신경망에 대한 닫힌 형태의 Jacobian 행렬식 표현을 제공합니다.
한계점: 제안된 방법은 모델 특정적일 수 있으며, 특히 기울기 흐름 변환은 Jacobian 행렬식 계산이 필요합니다. $n \ll p$ 데이터셋에 대한 실험 결과만 제시되어 일반적인 성능을 보장하기 어렵습니다. 적절한 변환을 찾는 것이 항상 가능한 것은 아닐 수 있습니다.
👍