Cet article présente un cadre d'évaluation de la robustesse des modèles prédictifs basés sur l'apprentissage profond (AP) pour la modélisation prédictive et la gestion de la santé (GPS) utilisant des données chronologiques complexes générées par des systèmes cyberphysiques (SCP) tels que la fabrication et la distribution d'énergie. Les évaluations de robustesse existantes présentent des limites : elles se concentrent sur la vérification formelle ou les interférences contradictoires et ne reflètent pas suffisamment la complexité des environnements SCP réels. Dans cet article, nous proposons une définition pratique de la robustesse basée sur la robustesse distributionnelle et présentons un cadre systématique pour analyser en profondeur la robustesse des modèles prédictifs sur des ensembles de données SCP réels en simulant des perturbations réalistes telles que la dérive des capteurs, le bruit et l'échantillonnage irrégulier. Nous démontrons l'applicabilité et l'efficacité de l'approche proposée par des études empiriques sur diverses architectures d'AP (notamment les modèles récurrents, convolutifs, basés sur l'attention, modulaires et structurés à espace d'état), et présentons des repères de robustesse pour encourager la recherche et la reproductibilité.