Cet article propose une nouvelle méthode pour résoudre le problème de fuite de timbre en conversion vocale (VC). Les informations timbriques du locuteur source sont intégrées à la représentation du contenu, réduisant ainsi la similarité avec le locuteur cible. À cette fin, nous introduisons le bloc résiduel de correspondance sémantique universelle (USM) dans l'extracteur de contenu. Ce bloc résiduel USM se compose de deux branches pondérées. La première branche est le module de réexpression des caractéristiques du contenu (CFR), basé sur un dictionnaire sémantique universel calculé statistiquement et utilisant la parole de divers locuteurs, qui fournit une représentation du contenu sans timbre. La seconde branche est une connexion par saut vers la couche de contenu d'origine, qui fournit des informations complémentaires plus fines. Le module CFR représente chaque trame de contenu comme une combinaison linéaire pondérée d'entrées du dictionnaire afin d'obtenir une représentation du contenu sans timbre. Grâce à des expériences approfondies sur différents frameworks de VC, nous démontrons que la méthode proposée atténue efficacement la fuite de timbre et améliore significativement la similarité avec le locuteur cible.