Cet article propose GOAT (GFlOwNet-guided Distribution Alignment), une nouvelle méthode pour traiter les hallucinations dans les systèmes de synthèse vocale (TTS) basés sur des modèles de langage. Contrairement aux méthodes existantes, GOAT est un cadre post-apprentissage qui atténue les hallucinations sans ressources d'apprentissage excessives ni délais d'inférence. Nous analysons la forte corrélation entre l'incertitude du modèle et les hallucinations et recadrons la génération de TTS comme un problème d'optimisation du flux de trajectoire, en utilisant des objectifs d'équilibre de sous-trajectoire améliorés et des récompenses internes finement ajustées comme distribution cible. Nous intégrons la réduction de la température de récompense et l'optimisation du taux d'apprentissage pour équilibrer stabilité et performance. Les résultats expérimentaux démontrent une excellente généralisation et une excellente efficacité, réduisant les taux d'erreur de caractères de plus de 50 % et l'incertitude jusqu'à 58 % sur les cas de test difficiles.