Sign In

Robust Simulation-Based Inference under Missing Data via Neural Processes

Created by
  • Haebom
Category
Empty

저자

Yogesh Verma, Ayush Bharti, Vikas Garg

개요

본 논문은 intractable likelihood function을 가진 모델의 파라미터 추론을 위한 Simulation-based Inference (SBI) 방법론에서, 관측 데이터의 결측값 문제를 다룬다. 기존 SBI 방법들은 완전 관측된 데이터를 필요로 하지만, 실제 데이터셋은 결측값을 포함하는 경우가 많다. 본 논문은 SBI에서 결측값 문제를 공식화하고, 단순한 결측값 대체 방법이 SBI posterior 추정에 bias를 유발할 수 있음을 보인다. 이를 해결하기 위해, Neural Posterior Estimation (NPE) framework 내에서 imputation model과 inference network를 함께 학습하는 새로운 amortized 방법을 제안한다. 다양한 수준의 결측값에 대한 SBI benchmark 실험 결과를 통해 제안 방법의 강건성을 보이고, 실제 생물 활성 데이터셋(Adrenergic 및 Kinase assays)에 대한 실험 결과도 제시한다. 코드는 https://github.com/Aalto-QuML/RISE 에서 확인 가능하다.

시사점, 한계점

시사점:
SBI에서 결측값 문제를 공식적으로 다루고, naive imputation의 문제점을 밝힘.
결측값 imputation과 inference network를 함께 학습하는 새로운 amortized 방법 제시.
다양한 실험을 통해 제안 방법의 강건성 및 효율성 검증.
실제 데이터셋을 이용한 실험 결과 제시.
한계점:
제안된 방법의 성능은 사용된 imputation model과 inference network의 설계에 의존적일 수 있음.
특정 유형의 결측 메커니즘에 대해서만 효과적일 가능성이 있음. (e.g., Missing Completely At Random (MCAR) 만 고려했을 가능성 존재)
실험에 사용된 데이터셋의 종류와 범위가 제한적일 수 있음.
👍