CLIMB: Class-imbalanced Learning Benchmark on Tabular Data
Created by
Haebom
저자
Zhining Liu, Zihao Li, Ze Yang, Tianxin Wei, Jian Kang, Yada Zhu, Hendrik Hamann, Jingrui He, Hanghang Tong
개요
본 논문은 표 형태의 데이터에서 클래스 불균형 학습(CIL) 문제를 다루는 포괄적인 벤치마크인 CLIMB를 제시합니다. CLIMB는 다양한 도메인과 불균형 수준을 가진 73개의 실제 데이터셋과 29개의 대표적인 CIL 알고리즘의 통합된 구현을 포함합니다. 고품질 오픈소스 Python 패키지, 통합 API 디자인, 자세한 설명서 및 엄격한 코드 품질 관리를 기반으로 구축되어 다양한 CIL 알고리즘 간의 구현 및 비교를 용이하게 합니다. 광범위한 실험을 통해 방법의 정확성과 효율성에 대한 실용적인 통찰력을 제공하고, 단순한 재조정의 한계, 앙상블의 효과, 데이터 품질의 중요성을 강조합니다. 코드, 설명서 및 예제는 https://github.com/ZhiningLiu1998/imbalanced-ensemble 에서 확인할 수 있습니다.