본 논문은 Pima Indians Diabetes Database의 768개 표본을 사용하여 당뇨병 위험 분류에 대한 통계적 및 비통계적 머신러닝 방법의 예측 능력을 조사합니다. 연령, BMI, 혈당 수치와 같은 중요한 인구 통계적 및 임상적 특징을 사용하여 로지스틱 회귀, 의사결정 트리, 랜덤 포레스트, K-최근접 이웃, 나이브 베이즈, 서포트 벡터 머신, 그래디언트 부스팅, 신경망 모델 등 다양한 머신러닝 알고리즘의 정확도와 효과를 평가했습니다. 신경망 알고리즘이 78.57%의 가장 높은 예측 정확도를 달성했으며, 랜덤 포레스트 알고리즘이 76.30%의 정확도로 그 뒤를 이었습니다. 이 연구 결과는 머신러닝 기법이 당뇨병 예측에 효과적이며, 데이터 기반의 조기 선별 도구로 활용될 수 있음을 시사합니다.