[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Generación de datos sintéticos basados en personas mediante condicionamiento multietapa con modelos de lenguaje amplios para el reconocimiento de emociones

Created by
  • Haebom

Autor

Keito Inoshita, Rushia Harada

Describir

En este artículo, presentamos PersonaGen, un novedoso marco de generación de texto rico en emociones que utiliza modelos de lenguaje a gran escala (LLM) para abordar la escasez de conjuntos de datos de emociones diversos y de alta calidad en el campo del reconocimiento de emociones. PersonaGen construye personajes virtuales jerárquicos combinando atributos demográficos, antecedentes socioculturales y contextos situacionales detallados para impulsar la generación de expresiones emocionales. Realizamos evaluaciones exhaustivas, que incluyen la evaluación de la diversidad semántica mediante métricas de agrupamiento y distribución, la evaluación de la semejanza humana mediante puntuaciones de calidad basadas en LLM, la evaluación del realismo mediante la comparación con corpus de emociones reales y la evaluación de la viabilidad para tareas posteriores de clasificación de emociones. Los resultados experimentales muestran que PersonaGen supera significativamente a los métodos de referencia en la generación de expresiones emocionales diversas, consistentes y discriminantes, lo que demuestra su potencial como una alternativa eficaz para complementar o reemplazar los conjuntos de datos de emociones reales.

Takeaways, Limitations

Takeaways:
Se presenta una nueva metodología para generar conjuntos de datos emocionales diversos y realistas utilizando LLM.
Contribuye a resolver el problema de la insuficiencia de conjuntos de datos emocionales existentes
Contribuye a mejorar el rendimiento de las tareas de clasificación de emociones posteriores.
Contribuir al avance de la investigación y los campos de aplicación de las emociones.
Limitations:
Dificultad para garantizar el realismo perfecto de los datos generados (existen diferencias con los datos emocionales reales)
El sesgo LLM puede afectar los datos generados
Existen limitaciones a la hora de reflejar perfectamente factores complejos como el entorno sociocultural y las características personales.
Cuestiones éticas (consideraciones éticas necesarias para crear y utilizar personajes virtuales)
👍