Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

DSO: Alineación de generadores 3D con retroalimentación de simulación para la solidez física

Created by
  • Haebom

Autor

Arruinando a Li, Chuanxia Zheng, Christian Rupprecht, Andrea Vedaldi

Describir

Este artículo presenta un método para generar objetos 3D estables, considerando las restricciones físicas requeridas para aplicaciones prácticas, particularmente la autosostenibilidad bajo gravedad. Los métodos existentes, que optimizan formas geométricas usando simuladores físicos diferenciables en tiempo de prueba, presentan limitaciones como lentitud, inestabilidad y tendencia a caer en óptimos locales. Inspirado por la investigación existente sobre la alineación de modelos generativos con retroalimentación externa, este artículo propone un marco de Optimización de Simulación Directa (DSO). DSO aprovecha la retroalimentación de un simulador no diferenciable para aumentar la probabilidad de que un generador 3D genere directamente objetos 3D estables. Construimos un conjunto de datos de objetos 3D etiquetados usando puntajes de estabilidad obtenidos de simuladores físicos y ajustamos el generador 3D usando Optimización de Preferencia Directa (DPO) o nuestra novedosa Optimización de Recompensa Directa (DRO), usando los puntajes de estabilidad como una métrica de alineación. Los resultados experimentales demuestran que un generador de avance ajustado mediante la función objetivo DPO o DRO es significativamente más rápido y tiene mayor probabilidad de generar objetos estables que una optimización en tiempo de prueba. En particular, el marco DSO puede recopilar automáticamente la retroalimentación de la simulación sobre su propia salida para mejorar el generador 3D, sin necesidad de utilizar objetos 3D existentes para el entrenamiento.

Takeaways, Limitations

Takeaways:
Presentamos un método de generación de objetos 3D eficiente y estable que supera los métodos de optimización del tiempo de prueba lentos e inestables existentes.
Presentamos un enfoque novedoso para ajustar modelos generativos a las restricciones físicas del mundo real aprovechando la retroalimentación de simuladores no diferenciables.
Proponemos una nueva función objetivo llamada optimización de recompensa directa (DRO) para alinear los modelos de difusión sin preferencias bidireccionales.
Demuestra el potencial de automejora de los modelos generativos sin la necesidad de datos existentes.
Limitations:
Se necesitan más investigaciones para determinar la generalidad de la función objetivo DRO propuesta y su aplicabilidad a otros modelos generativos.
Es necesario analizar el impacto de la precisión y las limitaciones del simulador de física utilizado en los resultados.
Es necesario evaluar el rendimiento de generalización para objetos 3D de diversas formas y complejidades.
Se requiere verificación del rendimiento y la estabilidad en aplicaciones del mundo real.
👍