Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

WildFireCan-MMD: Un conjunto de datos multimodales para la clasificación de contenido generado por el usuario durante incendios forestales en Canadá

Created by
  • Haebom

Autor

Braeden Sherritt, Isar Nejadgholi, Efstratios Aivaliotis, Khaled Mslmani, Marzieh Amini

Describir

Este documento enfatiza la importancia de acceder a información en tiempo real sobre situaciones de incendios forestales en Canadá y se centra en el aprovechamiento de los datos de las redes sociales para superar las limitaciones de las fuentes de datos existentes. Específicamente, presentamos WildFireCan-MMD, un conjunto de datos multimodal (texto e imagen) de redes sociales sobre incendios forestales que falta en el contexto canadiense. Este conjunto de datos anota publicaciones recientes relacionadas con incendios forestales canadienses (X) en 12 temas clave. Comparamos un modelo de visión-lenguaje (VLM) de disparo cero, un modelo entrenado a medida y un clasificador de línea base, demostrando que el modelo entrenado a medida supera tanto al modelo de disparo cero como al clasificador de línea base (84,48% f-score) cuando se dispone de datos etiquetados. Además, proponemos un método para identificar tendencias de incendios forestales utilizando conjuntos de datos a gran escala y sin etiquetar, enfatizando la importancia de los conjuntos de datos específicos de la región.

Takeaways, Limitations

Takeaways:
Ofrecemos WildFireCan-MMD, un conjunto de datos multimodales especializado para situaciones de incendios forestales en Canadá, que puede contribuir a futuras investigaciones de respuesta a incendios forestales.
Demostramos experimentalmente que el modelo entrenado personalizado supera a los clasificadores VLM y de línea base de disparo cero.
Proponemos un método para identificar tendencias en situaciones de incendios forestales mediante el análisis de conjuntos de datos no etiquetados a gran escala.
Destaca la importancia de los conjuntos de datos específicos de cada región y proporciona Takeaways para desarrollar estrategias de respuesta ante desastres.
Limitations:
Tal vez sea necesario discutir más a fondo el tamaño y la diversidad del conjunto de datos WildFireCan-MMD.
El desafío de obtener datos etiquetados necesarios para entrenar modelos personalizados aún existe.
Se necesitan más investigaciones para determinar la generalización en diferentes regiones y contextos.
👍