SMOTE는 불균형 학습 문제에서 클래스 균형을 맞추기 위한 기존의 기하학적 랜덤 오버샘플링 기법입니다. 기존 SMOTE는 소수 클래스의 기존 데이터 포인트와 k-최근접 이웃 간의 볼록 결합을 통해 새로운 합성 데이터 포인트를 생성합니다. 본 논문에서는 SMOTE를 기하학적 이웃 그래프의 모서리에서의 샘플링으로 보고, 위상 데이터 분석의 도구를 활용하여 새로운 기법인 Simplicial SMOTE를 제안합니다. Simplicial SMOTE는 충분히 가까운 임의의 개수의 데이터 포인트로 구성된 단체(simplex)에서 샘플링합니다. 기존의 쌍(pair) 대신 다수의 데이터 포인트로 구성된 단체를 사용하여 기하학적 데이터 모델을 대체함으로써 기존의 기하학적 샘플링 방법보다 기저 데이터 분포를 더 잘 커버하고, 결정 경계에서 다수 클래스에 더 가까운 소수 클래스의 합성 포인트를 생성합니다. 실험 결과, Simplicial SMOTE는 기존 SMOTE를 포함한 여러 가지 인기 있는 기하학적 샘플링 방법보다 성능이 우수함을 보여줍니다. 또한, 단체 샘플링을 기존 SMOTE 확장 기법에 쉽게 통합할 수 있음을 보여주고, Borderline SMOTE, Safe-level SMOTE, ADASYN 알고리즘의 단체 기반 확장을 일반화하고 평가하여 그래프 기반의 대응 기법보다 성능이 우수함을 확인했습니다.