[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

SEGURO: Conversación encarnada consciente de la semántica bajo la inconsciencia para el aprendizaje robótico permanente

Created by
  • Haebom

Autor

Rimvydas Rubacius, Peter David Fagan, Alex Lascarides, Subramanian Ramamoorthy

Describir

Este artículo aborda un desafiante escenario de aprendizaje interactivo denominado "reubicación a ciegas", en el que el agente debe manipular un entorno rígido sin conocer los conceptos clave necesarios para resolver la tarea. Por ejemplo, un usuario podría pedirle al agente que "ponga dos manzanas Granny Smith en una cesta", pero el agente no puede identificar con precisión qué objeto del entorno es una "Granny Smith" porque no ha estado expuesto previamente a dichos conceptos. En este artículo, presentamos SECURE, una política de aprendizaje interactivo diseñada para abordar estos escenarios. Una característica única de SECURE es su capacidad para realizar análisis semántico al procesar conversaciones corporizadas y tomar decisiones. A través de las conversaciones corporizadas, el agente SECURE aprende de la retroalimentación correctiva corporizada del usuario al cometer errores y participa estratégicamente en las conversaciones para descubrir información útil sobre nuevos conceptos relevantes para la tarea. Esta capacidad le permite generalizar el conocimiento adquirido a nuevas tareas. Demostramos que los agentes SECURE que resuelven reubicaciones en un entorno simulado de Blocksworld y en un entorno real de manipulación de manzanas sin conciencia son más eficientes en el uso de datos que los agentes que no participan en conversaciones o análisis semánticos.

Takeaways, Limitations

Takeaways:
Un nuevo método para resolver eficazmente la tarea de reubicación en un estado inconsciente a través del diálogo implementado y el análisis semántico.
Prueba experimental de la eficiencia de los datos de los agentes SECURE
Mejorar la capacidad del agente para aprender y generalizar nuevos conceptos.
Limitations:
Actualmente se evalúa únicamente en simulaciones y en entornos reales limitados. Se requiere verificación del rendimiento en entornos más diversos y complejos.
Alta dependencia de la retroalimentación de los usuarios. Es necesario mejorar la gestión de la retroalimentación imprecisa o imprecisa.
Se requiere verificación de escalabilidad para tareas complejas y de gran escala
👍