Este artículo destaca las deficiencias de los sistemas de recomendación secuencial existentes (SeqRec), que se basan principalmente en el cálculo directo para capturar patrones secuenciales, por lo que carecen de una comprensión de las complejas variaciones en las preferencias del usuario y de los elementos de cola larga. Para abordar esto, proponemos ReaRec, un marco de cálculo en tiempo de inferencia. ReaRec introduce autorregresivamente el último estado oculto de una secuencia en el sistema de recomendación secuencial e integra una incrustación especial de posición inferida para separar el espacio de codificación del elemento original del espacio de inferencia multinivel, mejorando así la representación del usuario. Además, presentamos el Aprendizaje de Razonamiento por Conjunto (ERL) y el Aprendizaje de Razonamiento Progresivo (PRL), métodos eficientes de aprendizaje basado en inferencia. Mediante experimentos exhaustivos en cinco conjuntos de datos públicos del mundo real y diversas arquitecturas SeqRec, demostramos la generalización y la eficacia de ReaRec, demostrando que mejora el rendimiento de múltiples estructuras de recomendación secuencial en aproximadamente un 30%-50%.