Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Mise à l'échelle adaptative du temps d'inférence via la recherche par diffusion cyclique

Created by
  • Haebom

Auteur

Gyubin Lee, Truong Nhat Nguyen Bao, Jaesik Yoon, Dongwoo Lee, Minsu Kim, Yoshua Bengio, Sungjin Ahn

Contour

Dans cet article, nous proposons une méthode adaptative de mise à l'échelle du temps d'inférence qui ajuste dynamiquement la charge de calcul pendant le processus d'inférence afin de résoudre le problème de mise à l'échelle du temps d'inférence des modèles de diffusion. Contrairement aux méthodes existantes qui reposent sur un programme fixe de suppression du bruit, nous proposons un nouveau cadre appelé Diffusion Cyclique Bidirectionnelle Adaptative (ABCD), qui améliore le résultat grâce à des cycles de diffusion bidirectionnelle et contrôle de manière adaptative la profondeur de recherche et le temps de terminaison. ABCD comprend trois composantes : la recherche par diffusion cyclique, l'équilibre exploration-exploitation automatique et le temps de réflexion adaptatif. Nous démontrons expérimentalement qu'elle améliore les performances tout en maintenant l'efficacité de calcul sur diverses tâches.

Takeaways, Limitations

Takeaways:
Nous présentons une nouvelle méthode pour améliorer l'efficacité de calcul des modèles de diffusion grâce à une mise à l'échelle adaptative du temps d'inférence.
La quantité de calcul peut être ajustée dynamiquement en fonction de la difficulté de la tâche ou des exigences spécifiques.
Assurer des performances améliorées et maintenir l'efficacité de calcul dans une variété de tâches.
Les cycles de diffusion bidirectionnels et le contrôle adaptatif offrent le potentiel d’une génération de sortie plus sophistiquée.
Limitations:
Difficulté de mise en œuvre et d’application en raison de la complexité du cadre ABCD.
Des recherches supplémentaires sont nécessaires sur les performances de généralisation dans différentes tâches.
Des recherches supplémentaires sont nécessaires pour déterminer comment définir des paramètres optimaux pour des tâches spécifiques.
Une vérification supplémentaire de l’applicabilité pratique et de l’évolutivité de la méthode proposée est nécessaire.
👍