본 논문은 장시간 비디오 처리의 높은 계산 비용 문제를 해결하기 위해, 차별적 증류(differential distillation)라는 새로운 방법을 제시합니다. 이 방법은 작업과 관련된 정보는 유지하면서 중복 정보는 제거하여 계산 효율성을 높입니다. 이 원리를 바탕으로 개발된 ViLAMP 모델은 프레임 단위의 차별적 키프레임 선택과 패치 단위의 차별적 특징 병합을 통해 시간적으로 긴 비디오를 "혼합 정밀도(mixed precision)"로 처리합니다. 키프레임은 완전한 정보를 유지하고, 비키프레임은 가장 중요한 특징만 유지하여 계산량을 줄입니다. 실험 결과, ViLAMP는 특히 장시간 비디오에서 우수한 성능을 보이며, 단일 NVIDIA A100 GPU에서 최대 10,000 프레임의 초장시간 비디오를 처리할 수 있음을 보여줍니다.