Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

DisCoRD: Tokens discretos para movimiento continuo mediante decodificación de flujo rectificado

Created by
  • Haebom

Autor

Jungbin Cho, Junwan Kim, Jisoo Kim, Minseo Kim, Mingu Kang, Sungeun Hong, Tae-Hyun Oh, Youngjae Yu

Describir

Este artículo presenta un método novedoso, Tokens Discretos a Movimiento Continuo mediante Decodificación de Flujo Rectificado (DisCoRD). Diseñado para abordar las diferencias entre las representaciones de movimiento discreto y continuo, utiliza flujo rectificado para decodificar tokens de movimiento discreto en un espacio de movimiento continuo sin procesar. Para abordar la expresividad limitada y los artefactos de ruido a nivel de fotograma de los métodos de generación discreta existentes, así como la dificultad de los enfoques continuos para cumplir con las señales condicionales, estructuramos la decodificación de tokens como una tarea de generación condicional para capturar movimientos sutiles y generar un movimiento más fluido y natural. Mejoramos la naturalidad a la vez que mantenemos la fidelidad a las señales condicionales en diversas configuraciones, logrando un rendimiento de vanguardia (FID 0,032 y 0,169, respectivamente) en los conjuntos de datos HumanML3D y KIT-ML.

Takeaways, Limitations

Takeaways:
Establece un nuevo estándar para la generación de movimiento humano al combinar la eficiencia de las representaciones discretas con el realismo de las representaciones continuas.
Las técnicas de decodificación de tokens que utilizan flujo rectificado son compatibles con varios marcos basados en datos discretos.
Demostramos la superioridad de nuestro método al lograr un rendimiento de última generación en los conjuntos de datos HumanML3D y KIT-ML.
Permite la creación de movimientos más naturales y suaves.
Limitations:
Se necesita más investigación para evaluar el rendimiento de generalización del método presentado en este artículo.
Se requiere evaluación del rendimiento en otros conjuntos de datos de movimiento.
El coste computacional del flujo estacionario puede ser elevado.
Se necesita una mayor validación de su aplicabilidad a conjuntos de datos muy grandes.
👍