정확한 시점의 세분화된 이벤트를 인식하는 PES (Precise event spotting)를 위한 UMEG-Net (Unified Multi-Entity Graph Network)을 제안합니다. UMEG-Net은 인체 골격과 스포츠 객체 키포인트를 통합 그래프로 구성하고, GCN (Graph Convolutional Network) 및 다중 스케일 시간 이동을 기반으로 한 효율적인 시공간 추출 모듈을 사용합니다. 또한, 키포인트 기반 그래프에서 시각적 표현으로 지식을 전이하기 위해 다중 모드 증류를 활용합니다. 제한된 라벨 데이터 환경에서 견고한 성능을 보이며, few-shot 설정에서 기존 모델보다 우수한 성능을 제공합니다.