Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Política de transformadores de difusión en el dispositivo para una manipulación eficiente del robot

Created by
  • Haebom

Autor

Yiming Wu, Huan Wang, Zhenghao Chen, Jianxin Pang, Dong Xu

Describir

Este artículo propone LightDP, un novedoso marco de trabajo diseñado para acelerar la implementación en tiempo real de políticas de difusión, la cual presenta dificultades debido a la limitación de recursos en dispositivos móviles. LightDP aborda los cuellos de botella computacionales mediante dos estrategias clave: la compresión de red del módulo de denoising y la reducción de los pasos de muestreo requeridos. Realizamos un análisis computacional exhaustivo de las arquitecturas de políticas de difusión existentes para identificar la red de denoising como un factor principal que contribuye a la latencia. Para superar la degradación del rendimiento asociada a los métodos de poda existentes, introducimos un proceso integrado de poda y reentrenamiento que optimiza explícitamente la resiliencia del modelo tras la poda. Además, combinamos técnicas de poda con destilación de consistencia para reducir eficazmente los pasos de muestreo, manteniendo al mismo tiempo la precisión de la predicción de acciones. Evaluaciones experimentales en conjuntos de datos estándar como PushT, Robomimic, CALVIN y LIBERO demuestran que LightDP alcanza un rendimiento competitivo para la predicción de acciones en tiempo real en dispositivos móviles, lo que representa un avance significativo hacia la implementación práctica de políticas basadas en difusión en entornos con recursos limitados. Amplios experimentos en el mundo real demuestran que el LightDP propuesto logra un rendimiento comparable a las políticas de difusión de última generación.

Takeaways, Limitations

Takeaways:
Presentamos un marco LightDP que permite la distribución en tiempo real de políticas de difusión en dispositivos móviles.
Abordar los cuellos de botella computacionales mediante la compresión de la red y la reducción de pasos de muestreo.
Mitigación de la degradación del rendimiento posterior a la poda con un proceso integrado de poda y reentrenamiento.
Reduzca los pasos de muestreo y mantenga la precisión utilizando la destilación consistente.
Logre predicción de movimiento en tiempo real y rendimiento de última generación en diversos conjuntos de datos (PushT, Robomimic, CALVIN, LIBERO).
Limitations:
Las mejoras de rendimiento de LightDP pueden depender de conjuntos de datos y arquitecturas específicas.
Se necesita más investigación sobre el rendimiento de generalización de la estrategia de poda y reentrenamiento propuesta.
Se necesitan experimentos adicionales para considerar la diversidad de tareas de manipulación de robots en entornos del mundo real.
Falta de análisis del consumo energético.
👍