Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Forecasting NCAA Basketball Outcomes with Deep Learning: A Comparative Study of LSTM and Transformer Models

Created by
  • Haebom

저자

Md Imtiaz Habib

개요

본 연구는 2025년 NCAA 1부 남녀 농구 토너먼트 결과 예측을 위해 심층 학습 방법론을 활용합니다. 역사적인 NCAA 경기 데이터를 활용하여 LSTM과 Transformer라는 두 가지 정교한 시퀀스 기반 모델을 구현했습니다. 일반화 선형 모델(GLM)에서 파생된 팀 품질 지표, Elo 등급, 시드 차이, 집계된 박스 스코어 통계를 포함한 포괄적인 특징 엔지니어링을 통해 모델의 예측력을 향상시켰습니다. 예측의 강건성과 신뢰성을 평가하기 위해 이진 교차 엔트로피(BCE)와 브라이어 손실 함수를 모두 사용하여 각 모델 변형을 훈련시켰으며, 분류 성능과 확률 보정에 대한 통찰력을 제공합니다. 비교 분석 결과, BCE로 최적화된 Transformer 구조가 우수한 판별력(AUC 0.8473)을 보이는 반면, 브라이어 손실로 훈련된 LSTM 모델은 우수한 확률 보정(브라이어 점수 0.1589)을 보임을 알 수 있었습니다. 이러한 결과는 예측 작업의 특정 요구 사항에 따라 적절한 모델 구조와 손실 함수를 선택하는 것이 중요함을 강조합니다. 여기서 제시된 자세한 분석 파이프라인은 스포츠 분석 및 그 이상의 미래 예측 모델링 작업을 위한 재현 가능한 프레임워크 역할을 합니다.

시사점, 한계점

시사점:
스포츠 예측에 LSTM과 Transformer 모델의 적용 가능성을 보여줌.
BCE와 Brier loss function의 선택에 따른 모델 성능 차이를 제시하여, 예측 목표에 따른 최적 손실 함수 선택의 중요성을 강조.
포괄적인 특징 엔지니어링을 통한 예측 정확도 향상 가능성 제시.
재현 가능한 분석 파이프라인 제공을 통한 향후 연구의 기반 마련.
한계점:
2025년 토너먼트 결과를 실제로 예측하지 않고, 과거 데이터 기반 모델 성능 평가에 그침. (미래 예측의 정확도는 검증되지 않음)
사용된 특징 변수의 한계. 다른 중요한 변수(부상, 선수의 컨디션 등) 고려 필요성.
모델의 일반화 성능에 대한 추가적인 검증 필요. (다른 스포츠 종목이나 데이터셋에 대한 적용 가능성 평가 필요)
👍