Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

CrisisSense-LLM: Modelo de lenguaje extenso optimizado para la clasificación de textos en redes sociales con múltiples etiquetas en informática de desastres.

Created by
  • Haebom

Autor

Kai Yin, Bo Li, Chengkai Liu, Ali Mostafavi, Xia Hu

Describir

Este artículo presenta un enfoque novedoso que supera las limitaciones de los modelos de clasificación de etiqueta única existentes al considerar la naturaleza multifacética y dinámica de los datos de redes sociales relacionados con desastres. Introducimos una técnica de ajuste fino de directivas que utiliza un modelo de lenguaje a gran escala (LLM) para realizar una clasificación multietiqueta de tuits relacionados con desastres. Creamos un conjunto completo de datos de directivas a partir de tuits relacionados con desastres y lo utilizamos para ajustar un LLM de código abierto que incorpore conocimiento específico sobre desastres. El modelo ajustado clasifica simultáneamente la información en múltiples dimensiones, incluyendo el tipo de desastre, el valor informativo y la intervención humanitaria, lo que mejora significativamente la utilidad de los datos de redes sociales para el conocimiento de la situación en situaciones de desastre. Los resultados experimentales demuestran que este enfoque mejora la clasificación de información crítica en publicaciones de redes sociales, haciéndola más efectiva para el conocimiento de la situación en situaciones de emergencia. Esto contribuye al desarrollo de herramientas de gestión de desastres más avanzadas, adaptativas y robustas que optimizan el conocimiento de la situación en tiempo real y las estrategias de respuesta.

Takeaways, Limitations

Takeaways:
La clasificación de múltiples etiquetas permite un análisis exhaustivo de diversos aspectos de los datos de las redes sociales relacionados con desastres.
Incorporar eficazmente conocimientos específicos sobre desastres en los modelos a través de técnicas de ajuste de directivas basadas en LLM.
Presentar la posibilidad de desarrollar herramientas efectivas de gestión de desastres que contribuyan a mejorar el conocimiento de las situaciones de desastre y las estrategias de respuesta.
Extracción eficiente de información necesaria para el conocimiento de la situación en tiempo real y la respuesta rápida
Limitations:
Falta de detalles específicos sobre el tamaño y la calidad del conjunto de datos utilizado.
Ausencia de análisis comparativo con otros modelos de clasificación multietiqueta
Falta de aplicación en tiempo real y evaluación del desempeño en situaciones reales de desastre
La posibilidad de utilizar conjuntos de datos sesgados hacia idiomas o regiones específicos y el potencial resultante de un desempeño de generalización deficiente.
👍