Este artículo propone LightDP, un novedoso marco de trabajo diseñado para acelerar la implementación en tiempo real de políticas de difusión, la cual presenta dificultades debido a la limitación de recursos en dispositivos móviles. LightDP aborda los cuellos de botella computacionales mediante dos estrategias clave: la compresión de red del módulo de denoising y la reducción de los pasos de muestreo requeridos. Realizamos un análisis computacional exhaustivo de las arquitecturas de políticas de difusión existentes para identificar la red de denoising como un factor principal que contribuye a la latencia. Para superar la degradación del rendimiento asociada a los métodos de poda existentes, introducimos un proceso integrado de poda y reentrenamiento que optimiza explícitamente la resiliencia del modelo tras la poda. Además, combinamos técnicas de poda con destilación de consistencia para reducir eficazmente los pasos de muestreo, manteniendo al mismo tiempo la precisión de la predicción de acciones. Evaluaciones experimentales en conjuntos de datos estándar como PushT, Robomimic, CALVIN y LIBERO demuestran que LightDP alcanza un rendimiento competitivo para la predicción de acciones en tiempo real en dispositivos móviles, lo que representa un avance significativo hacia la implementación práctica de políticas basadas en difusión en entornos con recursos limitados. Amplios experimentos en el mundo real demuestran que el LightDP propuesto logra un rendimiento comparable a las políticas de difusión de última generación.