[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Desafío ERR@HRI 2.0: Detección multimodal de errores y fallos en conversaciones entre humanos y robots

Created by
  • Haebom

Autor

Shiye Cao, Maia Stiber, Amama Mahmood, Maria Teresa Parreira, Wendy Ju, Micol Spitale, Hatice Gunes, Chien-Ming Huang

Describir

Este artículo presenta el reto ERR@HRI 2.0 para detectar y resolver errores (p. ej., malentendidos de la intención del usuario, interrupciones del usuario en la conversación y falta de respuesta) en robots conversacionales basados en modelos de lenguaje a gran escala (LLM). El reto proporciona un conjunto de datos de interacción humano-robot de 16 horas (que contiene características faciales, vocales y de movimiento de la cabeza), anotado con la presencia de errores del robot y las intenciones de corrección del usuario. Los participantes desarrollarán modelos de aprendizaje automático para detectar errores del robot utilizando datos multimodales y serán evaluados en función de métricas como la precisión de la detección y la tasa de falsos positivos. Este es un paso importante para mejorar la detección de errores en la interacción humano-robot mediante el análisis de señales sociales.

Takeaways, Limitations

Takeaways:
Presentación de un criterio de evaluación comparativa estandarizado para la investigación de detección y resolución de errores en robots conversacionales basados en LLM
Promoción del desarrollo de modelos de detección de errores de robots utilizando datos de diversos modos
Contribuye a mejorar la fiabilidad y eficiencia de la interacción humano-robot.
Contribuir al desarrollo de la investigación sobre la interacción humano-robot basada en el análisis de señales sociales.
Limitations:
Limitaciones en el tamaño y la diversidad del conjunto de datos (16 horas de datos pueden no ser suficientes)
Subjetividad y potencial de error en los comentarios
Es necesaria la verificación del rendimiento de generalización en entornos reales.
Es posible que no cubra todos los tipos de errores de robot.
👍