Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

SConU : Incertitude conforme sélective dans les grands modèles linguistiques

Created by
  • Haebom

Auteur

Zhiyuan Wang, Qingni Wang, Yue Zhang, Tianlong Chen, Xiaofeng Zhu, Xiaoshuang Shi, Kaidi Xu

Contour

Cet article souligne la nécessité de métriques spécifiques aux tâches pour un déploiement fiable des modèles linguistiques à grande échelle, de plus en plus utilisés dans les applications réelles. Si les critères d'incertitude existants, basés sur la prédiction à critères séparés, offrent une couverture de précision personnalisée, ils ne parviennent pas à identifier les valeurs aberrantes des données incertaines qui violent l'hypothèse d'interchangeabilité, ce qui conduit à des taux d'erreur d'application illimités et à des ensembles de prédiction peu pratiques. Par conséquent, dans cet article, nous proposons une nouvelle approche appelée incertitude des critères sélectifs (SConU). SConU est la première à mettre en œuvre un test de signification permettant de déterminer si un échantillon donné s'écarte de la distribution d'incertitude de l'ensemble d'étalonnage à un certain niveau de risque gérable, en développant deux valeurs p de critère. Cette approche permet non seulement de contrôler strictement les taux d'erreur d'application, mais aussi d'améliorer l'efficacité de la prédiction dans des contextes mono-domaines et interdisciplinaires. De plus, nous analysons en détail les composants de la procédure de critère pour approximer la couverture conditionnelle, en particulier dans les tâches de questions-réponses à enjeux élevés.

Takeaways, Limitations

Takeaways:
Une nouvelle approche des garanties métriques spécifiques aux tâches pour un déploiement fiable de modèles linguistiques à grande échelle
Gérez strictement les taux d'application erronée et améliorez l'efficacité de la prédiction grâce à l'incertitude des critères sélectifs (SConU).
Applicable dans des contextes monodisciplinaires et interdisciplinaires
Tentatives d'approximation de la couverture conditionnelle dans les tâches de questions-réponses à enjeux élevés
Limitations:
Une vérification expérimentale supplémentaire des performances réelles et des performances de généralisation de SConU est nécessaire.
Il est nécessaire d'évaluer l'évolutivité de SConU pour les données de grande dimension ou les modèles complexes
Des conseils supplémentaires sont nécessaires pour choisir les valeurs p et définir les niveaux de risque
Il se peut qu’une solution parfaite à la violation de l’hypothèse d’échangeabilité fasse encore défaut.
👍