Cet article propose un cadre non autorégressif pour résoudre des problèmes d'optimisation combinatoire sans prise de décision séquentielle, en l'appliquant au problème du voyageur de commerce (TSP). En appliquant une transformation similaire au cycle hamiltonien, le modèle apprend à approximer la matrice de permutation par relaxations successives. Cette approche d'apprentissage non supervisé offre des performances compétitives par rapport aux algorithmes heuristiques existants, démontrant que la structure intrinsèque du problème peut guider efficacement l'optimisation combinatoire sans prise de décision séquentielle.