Este artículo destaca el control emocional incompleto y limitado de los sistemas de texto a voz (TTS) existentes y propone EmoSteer-TTS, un novedoso método que permite un control preciso de las emociones de la voz (transformación, interpolación y eliminación) sin entrenamiento. EmoSteer-TTS altera eficazmente el tono emocional del habla sintetizada modificando las activaciones internas de un modelo TTS basado en la coincidencia de flujo. Desarrollamos un algoritmo eficiente y sin entrenamiento que incluye la extracción de activaciones, la recuperación de tokens emocionales y el control en tiempo de inferencia, haciéndolo compatible con diversos modelos preentrenados. Mediante la construcción de un conjunto de datos de habla emocional de diversos hablantes, derivamos vectores de control efectivos. Los resultados experimentales demuestran un control preciso, interpretable y continuo de las emociones de la voz que supera el rendimiento de los sistemas de última generación (SOTA). Este es el primer método que logra un control emocional continuo y preciso sin entrenamiento.