Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

WildFireCan-MMD : un ensemble de données multimodales pour la classification du contenu généré par les utilisateurs lors des feux de forêt au Canada

Created by
  • Haebom

Auteur

Braeden Sherritt, Isar Nejadgholi, Efstratios Aivaliotis, Khaled Mslmani, Marzieh Amini

Contour

Cet article souligne l'importance d'accéder à des informations en temps réel sur les feux de forêt au Canada et met l'accent sur l'exploitation des données des médias sociaux pour surmonter les limites des sources de données existantes. Plus précisément, nous présentons WildFireCan-MMD, un ensemble de données multimodales (texte et image) sur les feux de forêt issues des médias sociaux, manquant dans le contexte canadien. Cet ensemble de données annote les publications récentes liées aux feux de forêt au Canada (X) en 12 thèmes clés. Nous comparons un modèle vision-langage (VLM) à zéro tir, un modèle personnalisé et un classificateur de base, démontrant que le modèle personnalisé surpasse le modèle à zéro tir et le classificateur de base (score f de 84,48 %) lorsque des données étiquetées sont disponibles. De plus, nous proposons une méthode pour identifier les tendances des feux de forêt à l'aide d'ensembles de données à grande échelle et non étiquetés, soulignant l'importance des ensembles de données spécifiques à une région.

Takeaways, Limitations

Takeaways:
Nous fournissons WildFireCan-MMD, un ensemble de données multimodales spécialisé dans les situations d'incendies de forêt au Canada, qui peut contribuer à la recherche future sur les interventions en cas d'incendies de forêt.
Nous démontrons expérimentalement que le modèle personnalisé formé surpasse les classificateurs VLM et de base à tir nul.
Nous proposons une méthode permettant d’identifier les tendances de la situation des incendies de forêt grâce à l’analyse d’ensembles de données non étiquetés à grande échelle.
Souligne l’importance des ensembles de données spécifiques à chaque région et fournit Takeaways pour l’élaboration de stratégies de réponse aux catastrophes.
Limitations:
Des discussions plus approfondies pourraient être nécessaires concernant la taille et la diversité de l’ensemble de données WildFireCan-MMD.
Le défi d’obtenir des données étiquetées nécessaires à la formation de modèles personnalisés existe toujours.
Des recherches supplémentaires sont nécessaires pour déterminer la généralisabilité dans différentes régions et contextes.
👍