Cet article propose AnomalyControl, un nouveau cadre de synthèse d'anomalies, pour pallier les lacunes des méthodes existantes de synthèse d'anomalies texte-image. Ces méthodes reposent uniquement sur des informations textuelles ou des caractéristiques visuelles grossièrement alignées, ne parvenant pas à capturer correctement les caractéristiques complexes des anomalies. AnomalyControl utilise des caractéristiques sémantiques intermodales comme signaux de guidage, codant les anomalies généralisées à partir d'invites de référence texte-image. Plus précisément, il utilise des paires d'invites incompatibles (invites de référence texte-image et invites textuelles cibles) et exploite le module de modélisation sémantique intermodale (CSM) et le mécanisme d'attention améliorée anomalie-sémantique (ASEA) pour se concentrer sur les schémas visuels subtils des anomalies, améliorant ainsi le réalisme et la pertinence contextuelle des caractéristiques d'anomalie générées. Enfin, l'adaptateur de carte sémantique (SGA) utilise les caractéristiques sémantiques intermodales comme informations préalables pour coder des signaux de guidage efficaces pour un processus de synthèse approprié et contrôlable. Les résultats expérimentaux démontrent qu'AnomalyControl surpasse les méthodes existantes et atteint des résultats de pointe dans la synthèse des anomalies et les tâches ultérieures.