Cet article propose LightDP, un nouveau framework conçu pour accélérer le déploiement en temps réel des politiques de diffusion, confronté à des difficultés liées aux ressources limitées des appareils mobiles. LightDP s'attaque aux goulots d'étranglement informatiques grâce à deux stratégies clés : la compression réseau du module de débruitage et la réduction des étapes d'échantillonnage requises. Nous menons une analyse informatique approfondie des architectures de politiques de diffusion existantes afin d'identifier le réseau de débruitage comme principal contributeur à la latence. Pour pallier la dégradation des performances associée aux méthodes d'élagage existantes, nous introduisons un pipeline intégré d'élagage et de réentraînement qui optimise explicitement la résilience post-élagage du modèle. De plus, nous combinons les techniques d'élagage avec la distillation de cohérence afin de réduire efficacement les étapes d'échantillonnage tout en préservant la précision de la prédiction d'actions. Des évaluations expérimentales sur des jeux de données standard tels que PushT, Robomimic, CALVIN et LIBERO démontrent que LightDP atteint des performances compétitives pour la prédiction d'actions en temps réel sur appareils mobiles, ce qui représente une avancée significative vers le déploiement pratique de politiques basées sur la diffusion dans des environnements aux ressources limitées. Des expériences approfondies en situation réelle démontrent que le LightDP proposé atteint des performances comparables à celles des politiques de diffusion de pointe.