Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Un estudio sobre la identificación de causalidad de eventos: taxonomía, desafíos, evaluación y perspectivas

Created by
  • Haebom

Autor

Qing Cheng, Zefan Zeng, Xingchen Hu, Yuehang Si, Zhong Liu

Describir

Este artículo presenta un estudio exhaustivo de la identificación de causalidad de eventos (ECI), una tarea esencial en el procesamiento del lenguaje natural (PLN) que detecta automáticamente las relaciones causales entre eventos en el texto. Definimos conceptos clave, formalizamos el problema de ECI y presentamos un protocolo de evaluación estándar. Desarrollamos un marco de clasificación que categoriza los modelos ECI en dos tareas principales: identificación de causalidad de eventos a nivel de oración (SECI) e identificación de causalidad de eventos a nivel de documento (DECI). Para SECI, revisamos modelos que utilizan coincidencia basada en patrones de características, clasificadores de aprendizaje automático, codificación semántica profunda, ajuste fino basado en indicaciones y estrategias de preentrenamiento de conocimiento causal y aumento de datos. Para DECI, nos centramos en enfoques que aprovechan la codificación semántica profunda, la inferencia de grafos de eventos y el ajuste fino basado en indicaciones. Prestamos especial atención a los avances recientes en ECI multilingüe e interlingüe y en ECI de disparo cero utilizando modelos lingüísticos a gran escala (LLM). Analizamos las fortalezas, limitaciones y desafíos de cada enfoque y realizamos evaluaciones cuantitativas exhaustivas en cuatro conjuntos de datos de referencia para evaluar rigurosamente el rendimiento de diversos modelos ECI. Finalmente, analizamos las futuras líneas de investigación y destacamos las oportunidades para seguir avanzando en este campo.

Takeaways, Limitations

Takeaways:
El modelo ECI se clasifica sistemáticamente en SECI y DECI para permitir una comprensión integral del estado de la investigación.
Proporciona una revisión exhaustiva de varios modelos ECI (coincidencia basada en patrones de características, aprendizaje automático, codificación semántica profunda, ajuste fino basado en indicaciones, preentrenamiento de conocimiento causal, etc.).
Reflejando las últimas tendencias de investigación, incluida la ECI multilingüe y translingüe y la ECI de cero disparos.
Presentamos evaluaciones experimentales rigurosas utilizando cuatro conjuntos de datos de referencia.
Contribuir al desarrollo del campo ECI sugiriendo futuras direcciones de investigación.
Limitations:
Es posible que los tipos de modelos ECI tratados en este documento no sean completamente exhaustivos.
A medida que surgen continuamente nuevos modelos ECI y conjuntos de datos, puede haber limitaciones a la hora de reflejar las últimas tendencias de investigación después de la publicación de un artículo.
Dificultad para aplicar criterios de evaluación uniformes a todos los modelos ECI.
Posible bajo rendimiento de generalización debido al uso de conjuntos de datos sesgados hacia un idioma o dominio específico.
👍