크리켓 샷 분류는 스포츠 비디오 분석에서 어려운 문제이며, 공간적 및 시간적 특징을 효과적으로 모델링해야 한다. 본 논문은 크리켓 샷 분류를 위해 7가지 딥러닝 접근 방식을 4가지 연구 패러다임에서 비교하는 최초의 포괄적인 기준 연구를 제시한다. 전통적인 CNN-LSTM 아키텍처, 어텐션 기반 모델, 비전 트랜스포머, 전이 학습 접근 방식, 그리고 현대적인 EfficientNet-GRU 조합을 통합된 벤치마크에서 구현하고 체계적으로 평가한다. 이전 논문에서 보고된 정확도(Balaji LRCN 96%, IJERCSE 99.2%, Sensors 93%)와 달리, 표준화된 재구현 결과는 각각 46.0%, 55.6%, 57.7%로 나타났다. 현대적인 SOTA 접근 방식인 EfficientNet-B0와 GRU 기반 시간 모델의 결합은 92.25%의 정확도를 달성했다. 모든 구현은 PyTorch Lightning을 사용하여 MLOps 관행을 따르며, 스포츠 비디오 분석 연구에서 표준화된 평가 프로토콜의 중요성을 보여주는 재현 가능한 연구 플랫폼을 제공한다.