단안 비디오에서 탁구공의 정확한 3D 모션을 얻는 것은 어려운 문제인데, 기존의 합성 데이터로 훈련된 방법은 실제 세계의 잡음이 많고 불완전한 공 및 테이블 감지에 일반화하는 데 어려움을 겪기 때문이다. 이에 따라 저자들은 전면 감지 작업과 후면 2D-to-3D 업리프팅 작업으로 문제를 나누는 새로운 2단계 파이프라인을 제안한다. 이를 통해 저자들은 새로 생성된 TTHQ 데이터 세트에서 풍부한 2D 감독으로 전면 구성 요소를 훈련할 수 있으며, 후면 업리프팅 네트워크는 물리적으로 정확한 합성 데이터로만 훈련된다. 업리프팅 모델은 누락된 감지 및 다양한 프레임 속도와 같은 일반적인 실제 아티팩트에 강하도록 특별히 재설계되었다. 공 감지기 및 테이블 키포인트 감지기를 통합하여, 저자들의 접근 방식은 개념 증명 업리프팅 방법을 3D 탁구 궤적 및 스핀 분석을 위한 실용적이고, 강력하며, 고성능의 종단간 애플리케이션으로 전환한다.