Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

DisCoRD : des jetons discrets au mouvement continu via le décodage de flux rectifié

Created by
  • Haebom

Auteur

Jungbin Cho, Junwan Kim, Jisoo Kim, Minseo Kim, Mingu Kang, Sungeun Hong, Tae-Hyun Oh, Youngjae Yu

Contour

Cet article présente une nouvelle méthode, Discrete Tokens to Continuous Motion via Rectified Flow Decoding (DisCoRD). Conçue pour traiter les différences entre les représentations de mouvement discret et continu, elle utilise le flux rectifié pour décoder les jetons de mouvement discret en un espace de mouvement brut continu. Pour pallier l'expressivité limitée et les artefacts de bruit au niveau de l'image des méthodes de génération discrète existantes, ainsi que la difficulté des approches continues à respecter les signaux conditionnels, nous structurons le décodage des jetons comme une tâche de génération conditionnelle afin de capturer les mouvements subtils et de générer un mouvement plus fluide et plus naturel. Nous améliorons le naturel tout en maintenant la fidélité aux signaux conditionnels dans divers contextes, obtenant des performances de pointe (FID 0,032 et 0,169, respectivement) sur les jeux de données HumanML3D et KIT-ML.

Takeaways, Limitations

Takeaways:
Il établit une nouvelle norme pour la génération de mouvements humains en combinant l'efficacité des représentations discrètes avec le réalisme des représentations continues.
Les techniques de décodage de jetons utilisant un flux rectifié sont compatibles avec divers cadres discrets.
Nous démontrons la supériorité de notre méthode en obtenant des performances de pointe sur les ensembles de données HumanML3D et KIT-ML.
Il permet une création de mouvements plus naturels et plus fluides.
Limitations:
Des recherches supplémentaires sont nécessaires pour évaluer les performances de généralisation de la méthode présentée dans cet article.
Une évaluation des performances sur d’autres ensembles de données de mouvement est requise.
Le coût de calcul de l’écoulement stationnaire peut être élevé.
Une validation supplémentaire de son applicabilité à de très grands ensembles de données est nécessaire.
👍