Este artículo propone un marco no autorregresivo para resolver problemas de optimización combinatoria sin toma de decisiones secuencial, aplicándolo al problema del viajante (TSP). Al aplicar una transformación similar al ciclo hamiltoniano, el modelo aprende a aproximar la matriz de permutación mediante relajaciones sucesivas. Este enfoque de aprendizaje no supervisado logra un rendimiento competitivo con los algoritmos heurísticos existentes, lo que demuestra que la estructura inherente del problema puede guiar eficazmente la optimización combinatoria sin toma de decisiones secuencial.