Cet article se concentre sur la génération de boucles (courts segments audio répétés), un élément important des genres dance et électronique. Les modèles de génération existants présentent le problème de ne pas garantir des transitions fluides entre le début et la fin en générant uniquement des formes d'onde courtes, ce qui entraîne des discontinuités. Cette étude résout ce problème en modifiant un modèle non autorégressif (MAGNeT) pour générer des jetons selon un schéma cyclique, de sorte que le modèle se concentre sur le début lors de la génération de la fin. La génération de boucles naturelles n'est possible que par inférence, sans apprentissage ni données supplémentaires. Des améliorations subjectives de la qualité sont confirmées, telles qu'une amélioration de 55 % de la perplexité des jetons à la connexion de la boucle et une amélioration de 70 % de la note moyenne aux tests d'écoute. Cela démontre l'efficacité d'une approche basée sur l'inférence et les avantages d'un modèle non autorégressif.