Este artículo propone un método novedoso para abordar el problema de la fuga de timbre en la conversión de voz (VC), donde la información de timbre del hablante fuente se integra en la representación del contenido, reduciendo así la similitud con el hablante objetivo. Para ello, introducimos el bloque residual de Coincidencia Semántica Universal (USM) en el extractor de contenido. El bloque residual USM consta de dos ramas ponderadas. La primera rama es el módulo de Reexpresión de Características de Contenido (CFR), basado en un diccionario semántico universal calculado estadísticamente utilizando el habla de varios hablantes, que proporciona la representación del contenido sin timbre. La segunda rama es una conexión de salto a la capa de contenido original, que proporciona información complementaria de grano fino. El módulo CFR representa cada marco de contenido como una combinación lineal ponderada de entradas del diccionario para obtener la representación del contenido sin timbre. Mediante experimentos exhaustivos en varios marcos de VC, demostramos que el método propuesto mitiga eficazmente la fuga de timbre y mejora significativamente la similitud con el hablante objetivo.