Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

LUMA : un ensemble de données de référence pour l'apprentissage à partir de données incertaines et multimodales

Created by
  • Haebom

Auteur

Grigor Bezirganyan, Sana Sellami, Laure Berti- Equille, Sébastien Fournier

Contour

LUMA est un nouvel ensemble de données conçu pour améliorer la fiabilité de l'apprentissage profond multimodal. Il intègre diverses sources d'information (texte, images, audio et vidéo) afin d'optimiser la prise de décision. Il étend l'ensemble de données CIFAR-10/100 existant en y ajoutant des données audio et textuelles. Il est spécifiquement conçu pour intégrer différents types et degrés d'incertitude, afin d'apprendre à partir de données incertaines. Les données audio ont été extraites de trois corpus audio, et les données textuelles ont été générées à l'aide du LLM Gemma-7B. LUMA est disponible sous forme de package Python incluant des fonctions permettant de générer plusieurs variations d'ensembles de données en contrôlant la diversité des données, la quantité de bruit dans chaque modalité et l'ajout d'échantillons hors distribution. Il fournit également un modèle de base pré-entraîné et trois méthodes de quantification de l'incertitude : Monte-Carlo Dropout, Deep Ensemble et Reliable Conflictive Multi-View Learning. Cela permet le développement, l'évaluation et l'analyse comparative de méthodes d'apprentissage profond multimodal fiables et robustes.

Takeaways, Limitations_

Takeaways:
Il facilite le développement de modèles multimodaux fiables en fournissant des ensembles de données multimodaux qui peuvent être injectés avec différents types et niveaux d’incertitude.
Nous fournissons des méthodes de quantification de l’incertitude et des modèles de base pour améliorer la commodité du chercheur.
Vous pouvez contribuer à la conception d’approches d’apprentissage automatique plus fiables et plus robustes pour les applications critiques pour la sécurité.
Il est fourni sous forme de package Python, ce qui le rend hautement accessible et utilisable.
Limitations:
Les méthodes actuelles de quantification de l’incertitude peuvent être limitées.
La taille de l’ensemble de données peut être relativement petite par rapport à d’autres grands ensembles de données multimodales.
Une validation supplémentaire de la qualité et de la diversité des données textuelles générées à l'aide de Gemma-7B LLM peut être requise.
Il se peut qu’il ne couvre pas tous les types d’incertitude.
👍