GeMix는 의료 영상 분류와 같이 현실적인 이미지 생성이 중요한 분야에서 기존 Mixup의 한계를 극복하기 위해 제안된 새로운 데이터 증강 기법입니다. 기존 Mixup의 단순한 픽셀 단위 보간 대신, 클래스 조건부 GAN(StyleGAN2-ADA)을 이용하여 레이블 정보를 고려한 학습 기반 보간을 수행합니다. 두 개의 레이블 벡터를 Dirichlet 분포에서 샘플링하고 Beta 분포 계수를 이용하여 혼합한 후, 이를 StyleGAN2-ADA에 조건으로 주어 시각적으로 일관성 있는 이미지를 생성합니다. COVIDx-CT-3 데이터셋을 이용한 실험 결과, 기존 Mixup보다 높은 macro-F1 score를 달성하며, 특히 COVID-19 검출에서 위음성률을 감소시키는 효과를 보였습니다. 기존 학습 파이프라인에 손쉽게 적용 가능하며, 코드 또한 공개되어 재현성을 높였습니다.