Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

CLIMB: Class-imbalanced Learning Benchmark on Tabular Data

Created by
  • Haebom

저자

Zhining Liu, Zihao Li, Ze Yang, Tianxin Wei, Jian Kang, Yada Zhu, Hendrik Hamann, Jingrui He, Hanghang Tong

개요

본 논문은 표 형태의 데이터에서 클래스 불균형 학습(CIL) 문제를 다루는 포괄적인 벤치마크인 CLIMB를 제시합니다. CLIMB는 다양한 도메인과 불균형 수준을 가진 73개의 실제 데이터셋과 29개의 대표적인 CIL 알고리즘의 통합된 구현을 포함합니다. 고품질 오픈소스 Python 패키지, 통합 API 디자인, 자세한 설명서 및 엄격한 코드 품질 관리를 기반으로 구축되어 다양한 CIL 알고리즘 간의 구현 및 비교를 용이하게 합니다. 광범위한 실험을 통해 방법의 정확성과 효율성에 대한 실용적인 통찰력을 제공하고, 단순한 재조정의 한계, 앙상블의 효과, 데이터 품질의 중요성을 강조합니다. 코드, 설명서 및 예제는 https://github.com/ZhiningLiu1998/imbalanced-ensemble 에서 확인할 수 있습니다.

시사점, 한계점

시사점:
다양한 도메인과 불균형 수준을 가진 실제 데이터셋을 포함하는 포괄적인 CIL 벤치마크 제공
29개의 대표적인 CIL 알고리즘의 통합된 구현 및 비교 지원
단순한 재조정의 한계, 앙상블의 효과, 데이터 품질의 중요성을 실험적으로 증명
오픈소스 Python 패키지를 통해 CIL 알고리즘의 구현 및 비교를 용이하게 함
한계점:
본 논문 자체에서는 특정 한계점을 명시적으로 언급하지 않음. 추후 연구를 통해 더욱 다양한 알고리즘이나 데이터셋을 포함하여 벤치마크를 확장할 수 있을 것으로 예상됨.
👍