Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

WATS : Calibrage des réseaux neuronaux graphiques avec mise à l'échelle de la température par ondelettes

Created by
  • Haebom

Auteur

Xiaoyang Li, Linwei Tao, Haohui Lu, Minjing Dong, Junbin Gao, Chang Xu

Contour

Dans cet article, nous proposons un nouveau cadre post-étalonnage, appelé Wavelength-based Temperature Scaling (WATS), pour résoudre le problème de l'inadéquation de l'estimation de la confiance des réseaux neuronaux graphes (GNN) avec la précision réelle des prédictions. WATS améliore l'estimation de la confiance en attribuant la température par nœud à l'aide des caractéristiques des ondelettes du graphe. Contrairement aux méthodes existantes, il étalonne efficacement la confiance sans information sur les nœuds voisins ni réentraînement du modèle. Nos expériences sur diverses structures de graphe et structures GNN montrent qu'il permet d'obtenir jusqu'à 42,3 % d'amélioration de l'erreur d'étalonnage attendue (ECE) et une réduction de 17,24 % de la variance d'étalonnage moyenne par rapport aux méthodes existantes.

Takeaways, Limitations_

Takeaways:
Nous présentons une nouvelle méthode de post-étalonnage (WATS) qui résout efficacement le problème d'estimation de la fiabilité des GNN.
Compensation de fiabilité sophistiquée nœud par nœud en tirant parti de l'évolutivité et de la sensibilité de phase des ondelettes graphiques.
Obtenez d'excellentes performances sans recyclage du modèle ni accès aux informations des voisins.
Maintenez des performances de calcul efficaces sur une large gamme de tailles et de densités de graphiques.
Limitations:
Une validation supplémentaire de la généralité de la méthode proposée est nécessaire, et une évaluation est nécessaire pour déterminer si elle dépend trop de certains types de structures graphiques.
Il est nécessaire d’étendre davantage l’analyse comparative avec d’autres méthodes post-étalonnage (par exemple, la comparaison utilisant différents types de mesures d’étalonnage).
Une évaluation plus approfondie des performances et de la stabilité lorsqu’elles sont appliquées à des systèmes critiques pour la sécurité est nécessaire.
👍