Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Redes neuronales de gráficos de larga y corta distancia y mejora del aprendizaje curricular para el reconocimiento de emociones en la conversación

Created by
  • Haebom

Autor

Xinran Li, Xiujuan Xu, Jiaqi Qiao

Describir

En este artículo, abordamos la práctica, pero desafiante, tarea del reconocimiento de emociones (ERC) en conversaciones y proponemos un novedoso enfoque multimodal: la red neuronal de grafos de corto alcance (LSDGNN). Basándonos en el grafo acíclico dirigido (DAG), construimos una red neuronal de grafos de largo alcance y una red neuronal de grafos de corto alcance para obtener características multimodales de enunciados distantes y adyacentes, respectivamente. Utilizamos un regularizador diferencial para que las características de largo y corto alcance sean lo más distintas posible en las expresiones, permitiendo a la vez la influencia mutua entre ambos módulos, e integramos módulos bilineales para facilitar la interacción de características. También proponemos un aprendizaje curricular mejorado (ICL) para abordar el problema del desequilibrio de datos. Diseñamos un índice de "cambio emocional ponderado" que enfatiza los cambios en emociones similares mediante el cálculo de la similitud entre diferentes emociones, y desarrollamos una medida de dificultad para facilitar un proceso de aprendizaje que aprende primero las muestras fáciles. Los resultados experimentales en los conjuntos de datos IEMOCAP y MELD muestran que el modelo propuesto supera los parámetros de referencia existentes.

Takeaways, Limitations

Takeaways:
Presentamos LSDGNN, un novedoso enfoque multimodal para el problema del reconocimiento de emociones en conversaciones, que logra mejoras de rendimiento sobre los métodos existentes.
Proponemos una arquitectura novedosa que utiliza eficazmente la información contextual de largo y corto alcance.
Proponemos un método de aprendizaje curricular mejorado para abordar el problema del desequilibrio de datos.
La importancia de los cambios emocionales se reflejó efectivamente a través del indicador “cambio emocional ponderado”.
Limitations:
La complejidad computacional del modelo propuesto puede ser alta.
Se necesitan más experimentos para determinar si las mejoras de rendimiento de un conjunto de datos específico se generalizarán a otros conjuntos de datos.
Se necesitan más investigaciones para investigar la generalidad del índice de “cambio emocional ponderado” y su aplicabilidad a otras tareas de reconocimiento de emociones.
Hay una falta de evaluación del desempeño de generalización del modelo en diversos orígenes lingüísticos y culturales.
👍