Afin de surmonter les limites des différents ensembles de données d'analyse de la parole synthétique, la distinction entre parole réelle et parole synthétique devenant de plus en plus importante en raison du risque croissant de fausses informations et d'usurpation d'identité, nous proposons un ensemble de données d'analyse forensique de la parole couvrant largement des échantillons de parole réels, synthétiques et partiellement falsifiés, contenant de multiples segments synthétisés par divers algorithmes de haute qualité. De plus, nous proposons un réseau de localisation temporelle de la parole (TEST) qui effectue simultanément la vérification d'authenticité, la localisation de multiples faux segments et la reconnaissance d'algorithmes synthétiques sans post-traitement complexe. TEST intègre efficacement LSTM et Transformer pour extraire des représentations temporelles robustes de la parole et estime les segments synthétiques à l'aide d'une prédiction dense sur des caractéristiques pyramidales multi-échelles. Le modèle proposé atteint un mAP moyen de 83,55 % et un EER de 5,25 % au niveau de l'énoncé, ainsi qu'un EER de 1,07 % et un score F1 de 92,19 % au niveau du segment, soulignant sa robustesse pour une analyse complète de la parole synthétique.