Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

CrisisSense-LLM : Modèle de langage étendu optimisé pour la classification de textes multi-étiquettes sur les réseaux sociaux en informatique de gestion des catastrophes

Created by
  • Haebom

Auteur

Kai Yin, Bo Li, Chengkai Liu, Ali Mostafavi, Xia Hu

Contour

Cet article présente une nouvelle approche qui surmonte les limites des modèles de classification mono-étiquette existants en prenant en compte la nature multidimensionnelle et dynamique des données des médias sociaux liées aux catastrophes. Nous introduisons une technique d'affinement directif qui utilise un modèle de langage à grande échelle (MLL) pour effectuer une classification multi-étiquettes des tweets liés aux catastrophes. Nous construisons un ensemble complet de données directives à partir de tweets liés aux catastrophes et l'utilisons pour affiner un LLM open source afin d'y intégrer des connaissances spécifiques aux catastrophes. Ce modèle affiné classe simultanément les informations selon plusieurs dimensions, notamment le type de catastrophe, la valeur informationnelle et l'intervention humanitaire, améliorant ainsi considérablement l'utilité des données des médias sociaux pour la connaissance de la situation en cas de catastrophe. Les résultats expérimentaux démontrent que cette approche améliore la classification des informations critiques dans les publications sur les médias sociaux, les rendant plus efficaces pour la connaissance de la situation en situation d'urgence. Cela contribue au développement d'outils de gestion des catastrophes plus avancés, adaptatifs et robustes, qui améliorent la connaissance de la situation en temps réel et les stratégies d'intervention.

Takeaways, Limitations

Takeaways:
La classification multi-étiquettes permet une analyse complète de divers aspects des données des médias sociaux liées aux catastrophes.
Intégrer efficacement les connaissances spécifiques aux catastrophes dans les modèles grâce à des techniques de réglage fin des directives basées sur le LLM.
Présenter la possibilité de développer des outils efficaces de gestion des catastrophes qui contribuent à améliorer la connaissance des situations de catastrophe et les stratégies de réponse.
Extraction efficace des informations nécessaires à une connaissance de la situation en temps réel et à une réponse rapide
Limitations:
Manque de détails spécifiques sur la taille et la qualité de l'ensemble de données utilisé.
Absence d'analyse comparative avec d'autres modèles de classification multi-étiquettes
Manque d'application en temps réel et d'évaluation des performances dans des situations de catastrophe réelles
La possibilité d’utiliser des ensembles de données biaisés en faveur de langues ou de régions spécifiques, et le risque potentiel de mauvaises performances de généralisation qui en résulte.
👍