Uncertainty-Aware Generative Oversampling Using an Entropy-Guided Conditional Variational Autoencoder
Created by
Haebom
저자
Amirhossein Zare (SeyedAbolfazl), Amirhessam Zare (SeyedAbolfazl), Parmida Sadat Pezeshki (SeyedAbolfazl), Herlock (SeyedAbolfazl), Rahimi, Ali Ebrahimi, Ignacio Vazquez-Garcia, Leo Anthony Celi
개요
LEO-CVAE는 고차원 생물 의학 데이터의 불균형 학습 문제를 해결하기 위한 새로운 생성적 oversampling 프레임워크이다. CVAE를 기반으로 하며, 지역 불확실성을 학습 및 데이터 생성 과정에 명시적으로 통합한다. 지역 엔트로피를 불확실성 측정에 활용하고, 이를 통해 불확실성이 높은 지역에서 더 견고한 학습을 수행하고, 해당 지역에 synthetic sample 생성을 집중한다. 임상 유전체 데이터셋(ADNI 및 TCGA 폐암)에 적용하여 기존 oversampling 및 생성 모델 대비 향상된 분류 성능을 보였다.
시사점, 한계점
•
시사점:
◦
불확실성 정보를 활용한 생성적 oversampling 기법의 효과 입증.
◦
생물 의학 데이터와 같이 복잡한 비선형 구조를 갖는 데이터에 대한 불균형 학습 문제 해결 가능성 제시.