Cet article présente une nouvelle approche pour générer des images médicales dynamiques, évolutives et précises à partir de descriptions textuelles, répondant ainsi au défi MEDVQA-GI. Pour surmonter les limites des méthodes existantes (analyse d'images statiques et absence de génération dynamique d'images médicales à partir de descriptions textuelles), nous avons intégré des modèles de diffusion stable et DreamBooth optimisés avec l'adaptation de bas rang (LORA) pour générer des images médicales de haute qualité. Le système se compose de deux sous-tâches : la synthèse d'images (IS) et la génération d'invites optimales (OPG). Les résultats d'évaluation montrent que la diffusion stable génère des images de meilleure qualité et plus diversifiées que CLIP et DreamBooth + LORA. Plus précisément, elle a obtenu le score FID le plus bas (0,099 pour les analyses monocentriques, 0,064 pour les analyses multicentriques et 0,067 pour les analyses combinées) et le score initial le plus élevé (moyenne sur l'ensemble des jeux de données : 2,327). Cette réussite devrait contribuer à l'avancement du diagnostic médical basé sur l'IA.