Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo. La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro. Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.
Primeros pasos para escuchar a los agentes de LLM: un estudio de caso con la jugabilidad de Dungeons & Dragons
Created by
Haebom
Autor
Andrew Zhu, Evan Osgood y Chris Callison-Burch
Describir
Este artículo presenta un paradigma novedoso, los "agentes de escucha", que difiere de los agentes LLM conversacionales existentes. Los agentes de escucha no participan directamente en las conversaciones; en cambio, escuchan a escondidas las conversaciones humanas y realizan tareas en segundo plano para ayudar al usuario o proporcionar sugerencias. Este estudio realiza una investigación exhaustiva utilizando modelos de audio-lenguaje multimodales a gran escala como agentes de escucha para apoyar al Dungeon Master en el contexto de la jugabilidad de Dungeons & Dragons. Evaluamos la usabilidad de estos agentes mediante evaluaciones humanas y descubrimos que algunos modelos de audio-lenguaje a gran escala son capaces de realizar tareas de agente de escucha utilizando señales de audio implícitas. Finalmente, publicamos una biblioteca de Python y el código del proyecto para respaldar la investigación futura sobre el paradigma del agente de escucha ( https://github.com/zhudotexe/overhearing_agents ).
Proponemos un nuevo paradigma para los agentes LLM conversacionales, el "agente de escucha", y exploramos sus posibilidades.
◦
Demostramos el potencial de un modelo de audio-lenguaje multimodal a gran escala para actuar como agente de escucha en el contexto específico de un juego de Dungeons & Dragons.
◦
Se ha descubierto la capacidad de realizar tareas utilizando señales auditivas implícitas en algunos modelos a gran escala.
◦
Apoyamos la investigación de seguimiento publicando bibliotecas y códigos de Python relacionados.
•
Limitations:
◦
Debido a que este estudio se limitó al contexto específico del juego Dungeons & Dragons, se necesita más investigación para determinar su generalización a otros contextos.
◦
Falta información detallada sobre los tipos y el rendimiento de los modelos a gran escala utilizados.
◦
Hay una falta de discusión sobre la privacidad y las cuestiones éticas de los agentes de espionaje.