본 연구는 미국 내 보행자 사망 사고의 주요 원인을 규명하기 위해 설명 가능한 인공지능(XAI)을 활용한 연구입니다. 2018년부터 2022년까지 보행자 사망 사고율이 가장 높은 5개 주와 가장 낮은 5개 주의 데이터를 비교 분석하여 결정 트리, 그래디언트 부스팅 트리, 랜덤 포레스트, XGBoost 등의 머신러닝 기법을 적용했습니다. 데이터 불균형 문제 해결을 위해 SMOTE 기법을 사용하였고, SHAP 값을 통해 모델의 해석성을 높였습니다. 분석 결과, 보행자 연령, 음주 및 약물 사용, 사고 발생 위치, 환경 조건이 보행자 사망 사고의 중요한 예측 변수로 나타났으며, XGBoost 모델이 가장 높은 예측 정확도(98%의 균형 정확도, 90%의 정확도, 92%의 정밀도, 90%의 재현율, 91%의 F1 점수)를 달성했습니다. 특히 중간 블록 위치, 시야가 좋지 않은 지역에서 사고 발생률이 높았으며, 고령자와 약물 및 알코올 사용자의 사망 위험이 높은 것으로 나타났습니다.