Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Anchor-based oversampling for imbalanced tabular data via contrastive and adversarial learning

Created by
  • Haebom
Category
Empty

저자

Hadi Mohammadi, Ehsan Nazerfard, Mostafa Haghir Chehreghani

개요

본 논문은 데이터 불균형 문제를 해결하기 위해 경계 앵커 샘플 기반의 새로운 딥 제너레이티브 모델인 Anch-SCGAN을 제안합니다. Anch-SCGAN은 사전 학습된 MLP 분류기를 이용하여 앵커 샘플을 선택하고, 소수 클래스와 다수 클래스에 대한 두 개의 생성기를 사용하며, 클래스별 정보를 통합한 판별기를 포함합니다. 새로운 생성기 손실 함수와 점수 기반 전략을 통해 생성 과정을 안정화하고, 앵커 샘플을 이용하여 미세 조정하여 생성된 샘플의 정확도를 향상시킵니다. 16개의 실제 불균형 데이터셋을 이용한 실험 결과, Anch-SCGAN이 기존의 불균형 학습 방법들보다 우수한 성능을 보임을 보여줍니다.

시사점, 한계점

시사점:
데이터 불균형 문제 해결을 위한 새로운 접근법인 경계 앵커 샘플 기반의 딥 제너레이티브 모델 Anch-SCGAN 제시.
기존 방법들보다 우수한 성능을 실험적으로 검증.
앵커 샘플을 활용한 사전 지식 및 생성 과정 안정화 전략 제시.
한계점:
제안된 모델의 성능이 특정 유형의 데이터 불균형에만 국한될 가능성.
앵커 샘플 선택 전략의 최적화 필요성.
다양한 종류의 데이터셋에 대한 추가적인 실험 필요성.
계산 비용이 높을 수 있음.
👍