Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Reorganización personalizada de objetos robóticos a partir del contexto de la escena

Created by
  • Haebom

Autor

Kartik Ramachandruni, Sonia Chernova

Describir

En este artículo, presentamos un novedoso benchmark PARSEC, que aprende las preferencias del usuario para colocar objetos en entornos parcialmente organizados y resolver el problema de reubicación de objetos en robots domésticos. PARSEC contiene 110.000 ejemplos de reubicación de 72 usuarios, obtenidos mediante colaboración colectiva, y abarca 93 categorías de objetos y 15 entornos. En este artículo, proponemos ContextSortLM, un modelo de reubicación personalizado basado en LLM que gestiona las preferencias flexibles del usuario considerando objetos que pueden colocarse en diversas ubicaciones. Evaluamos ContextSortLM y los enfoques de reubicación personalizados existentes en el benchmark PARSEC, y evaluamos la coherencia de las predicciones del modelo con las preferencias del usuario mediante una evaluación colaborativa realizada por 108 evaluadores en línea. Como resultado, demostramos que los modelos de reubicación personalizados que utilizan múltiples fuentes de contexto de escena superan a los que se basan en una única fuente de contexto, y ContextSortLM reproduce mejor las ubicaciones de los usuarios que otros modelos y se sitúa entre los dos primeros en todas las categorías de entorno según los evaluadores en línea. Finalmente, destacamos los desafíos asociados con el modelado del significado ambiental en diferentes categorías ambientales y ofrecemos recomendaciones para futuras investigaciones.

Takeaways, Limitations

Takeaways:
Presentamos un nuevo punto de referencia, PARSEC, que reorganiza los objetos aprendiendo las preferencias de los usuarios, lo que puede estimular la investigación relacionada.
Demostramos que el rendimiento de la reubicación personalizada de objetos se puede mejorar utilizando el modelo ContextSortLM, que considera objetos que se pueden colocar en diferentes ubicaciones.
Demostramos experimentalmente que aprovechar múltiples fuentes de contexto de escena supera a una sola fuente de contexto.
Limitations:
Destacamos los desafíos en el modelado del significado ambiental en diversas categorías ambientales y sugerimos direcciones para futuras investigaciones.
(El Limitations específico no se menciona explícitamente en el artículo, pero se considera que la dificultad de modelar la semántica ambiental es un Limitations importante)
👍