Para abordar el alto coste computacional del procesamiento de vídeo de larga duración, este artículo propone un novedoso método denominado destilación diferencial. Este método mejora la eficiencia computacional al retener la información relevante para la tarea y eliminar la información redundante. Basándose en este principio, el modelo ViLAMP, desarrollado, procesa vídeos de larga duración con precisión mixta mediante la selección diferencial de fotogramas clave fotograma a fotograma y la fusión diferencial de características parche a parche. Los fotogramas clave retienen la información completa, mientras que los fotogramas no clave solo conservan las características más importantes, lo que reduce la sobrecarga computacional. Los resultados experimentales demuestran que ViLAMP ofrece un rendimiento especialmente bueno en vídeos de larga duración, capaz de procesar vídeos de duración ultralarga de hasta 10 000 fotogramas en una sola GPU NVIDIA A100.