Dans cet article, nous proposons Spotlight-TTS pour relever les défis de la synthèse vocale expressive de haute qualité, en nous appuyant sur des études récentes suggérant diverses méthodes basées sur l'intégration de styles extraits de la parole de référence dans la synthèse vocale expressive (TTS). Spotlight-TTS met exclusivement l'accent sur les styles grâce à l'extraction et à l'ajustement de la direction du style. L'extraction de styles basée sur la parole se concentre sur les segments sonores présentant une pertinence stylistique élevée tout en maintenant la continuité entre les différents segments afin d'améliorer l'expressivité. De plus, elle améliore la qualité vocale en ajustant la direction du style extrait et en l'intégrant de manière optimale au modèle TTS. Les résultats expérimentaux montrent que Spotlight-TTS surpasse les modèles de base en termes d'expressivité, de qualité vocale globale et de transférabilité du style, et ses échantillons de parole sont accessibles au public.