Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Quantification de l'erreur d'étalonnage dans les réseaux neuronaux grâce à une théorie fondée sur des preuves

Created by
  • Haebom

Auteur

Koffi Ismaël Ouattara, Ioannis Krontiris, Theo Dimitrakos, Frank Kargl

Contour

Cet article propose un nouveau cadre pour améliorer l'erreur d'étalonnage attendue (ECE) basé sur la logique subjective afin d'évaluer la fiabilité des réseaux neuronaux. Les mesures existantes, telles que l'exactitude et la précision, présentent des limites pour refléter adéquatement la confiance, la confiance et l'incertitude, et, en particulier, ne parviennent pas à résoudre le problème de l'excès de confiance. La méthode proposée regroupe les probabilités prédites et mesure de manière exhaustive la confiance, la méfiance et l'incertitude à l'aide d'opérateurs de fusion appropriés. Les résultats expérimentaux obtenus à partir des données MNIST et CIFAR-10 démontrent une fiabilité améliorée après étalonnage. Ce cadre offre une interprétabilité et une évaluation précise des modèles d'IA dans des domaines sensibles tels que la santé et les systèmes autonomes.

Takeaways, Limitations

Takeaways:
Un nouveau cadre qui prend en compte de manière exhaustive la confiance, la méfiance et l’incertitude en introduisant une logique subjective dans l’évaluation de la fiabilité.
Contribue à résoudre le problème de l'excès de confiance, une limitation des indicateurs existants
Cela suggère le potentiel d’améliorer la fiabilité et l’interprétabilité des modèles d’IA dans des domaines sensibles tels que les soins de santé et la conduite autonome.
L’efficacité de la méthode proposée est vérifiée par des expériences sur les ensembles de données MNIST et CIFAR-10.
Limitations:
Des recherches supplémentaires sont nécessaires sur les performances de généralisation du cadre proposé.
La nécessité d’étendre les résultats expérimentaux à divers ensembles de données et modèles.
Des recherches supplémentaires sont nécessaires sur les paramètres de la logique subjective et la sélection des opérateurs de fusion.
Des recherches et des validations supplémentaires sont nécessaires pour des applications pratiques.
👍