Este artículo presenta un método novedoso para abordar las limitaciones de las entradas de longitud fija en la predicción de series temporales a largo plazo. Los modelos de aprendizaje profundo existentes sufren sobreajuste a medida que aumenta la longitud de las entradas, lo que conlleva una rápida disminución de la precisión. Esto se atribuye a la combinación de patrones multiescala en las series temporales y la escala de enfoque fija del modelo. Este estudio revela que los patrones que aparecen en diversas escalas en las series temporales reflejan características multiciclo, correspondiendo cada escala a una longitud de ciclo específica. Además, revela que el tamaño del token determina el comportamiento del modelo, determinando las escalas en las que se centra y el tamaño del contexto que puede acomodar. Por lo tanto, proponemos un método novedoso que separa los patrones temporales multiescala en las series temporales y modela cada patrón como un tamaño de token que representa su longitud de ciclo correspondiente. Mediante la introducción del Módulo de Descomposición de Series Temporales (MPSD) y la Red Neuronal de Reconocimiento de Patrones Multitoken (MTPR), podemos procesar entradas hasta 10 veces más largas, mejorando el rendimiento hasta en un 38 %, reduciendo la complejidad computacional en 0,22 veces y mejorando la interpretabilidad.