본 논문은 범암종 유전자 발현 분류를 위한 새로운 심층 학습 프레임워크를 제안합니다. TCGA 데이터셋의 5가지 암종 801개 RNA-Seq 샘플을 사용하여, 20,531개 유전자 발현 특징을 500개의 변이가 가장 큰 유전자로 특징 선택 후, 조건부 변이 자기 인코더(cVAE)를 이용하여 각 암종에 대한 합성 유전자 발현 샘플을 생성합니다. 생성된 합성 데이터로 학습 데이터셋을 늘려 과적합과 클래스 불균형 문제를 완화하고, 이를 이용하여 다층 퍼셉트론(MLP) 분류기를 학습시킵니다. 결과적으로, 기존 데이터만 사용한 분류기보다 훨씬 높은 (~98%) 분류 정확도를 달성하며, 특히 표현이 부족한 암종에서 성능 향상을 보입니다.