Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

FunGraph: Gráficos de escenas 3D con funcionalidades para interacción entre escenas basada en el lenguaje

Created by
  • Haebom

Autor

Dennis Rotondi, Fabio Scaparro, Hermann Blum, Kai O. Arras

Describir

Este trabajo busca desarrollar una representación de grafos de escena 3D que identifique la ubicación y el uso de elementos de interacción funcional, permitiendo a los robots interactuar directamente con sus entornos. En lugar de basarnos en la resolución tradicional a nivel de objeto, nos centramos en detectar y almacenar objetos con una resolución más precisa, priorizando su importancia funcional. Para abordar la escasez de datos y los desafíos de capturar características detalladas de los objetos mediante sensores robóticos, aprovechamos los recursos 3D existentes para generar datos 2D y entrenar detectores, optimizando así el proceso estándar de generación de grafos de escena 3D. Los resultados experimentales demuestran que nuestro enfoque logra un rendimiento de segmentación de elementos funcionales comparable al de los modelos 3D de vanguardia y permite asociaciones semánticas funcionales basadas en tareas con mayor precisión que las soluciones existentes.

Takeaways, Limitations

Takeaways:
Presentamos una novedosa representación gráfica de escena en 3D que identifica la ubicación y el uso de elementos de interacción funcional.
Mejora de la interacción robot-entorno mediante la detección y almacenamiento de objetos de alta resolución.
Mejora del rendimiento del proceso de generación de gráficos de escenas 3D a través del aumento de datos 2D.
Segmentación de elementos funcionales y vinculación semántica funcional orientada a tareas para lograr un rendimiento de vanguardia.
Limitations:
Dificultad para capturar características detalladas de objetos utilizando sensores de robot.
Falta de datos más allá de la detección a nivel de instancia.
Utilización de una gama limitada de recursos 3D.
👍