본 논문은 항공 안전 조사관이 항공 사건을 사고 또는 심각한 사고 범주로 분류하는 것을 돕기 위해 지도 학습 기반 머신러닝(ML) 모델을 사용하는 실용적인 접근 방식을 제시한다. 공개적으로 이용 가능한 항공 조사 보고서에서 파생된 레이블이 지정된 데이터 세트를 사용하여 훈련된 ML 웹 애플리케이션으로 구현되었다. 지원 벡터 머신, 로지스틱 회귀, 랜덤 포레스트 분류기, XGBoost, K-최근접 이웃 등 다섯 가지 지도 학습 모델을 평가한 결과, 랜덤 포레스트 분류기가 정확도 0.77, F1 점수 0.78, MCC 0.51 (100회 샘플 실행 평균)으로 가장 좋은 성능을 보였다. 또한 불균형 데이터 세트에 합성 소수 과대 샘플링 기법(SMOTE)을 적용한 효과를 조사하였으며, 전체적으로 SMOTE 조정 후 일부 모델의 성능에는 유의미한 영향이 없었거나 성능이 크게 저하되는 것으로 나타났다.