Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Validation croisée non redondante à k plis

Created by
  • Haebom

Auteur

Jésus S. Aguilar-Ruiz

Contour

La validation croisée k-fold conventionnelle présente le problème d'utiliser chaque instance pour l'entraînement (k-1) et de la tester une seule fois, ce qui entraîne une redondance et un impact disproportionné sur le processus d'apprentissage en raison de la multiplicité des instances. Dans cet article, nous présentons une nouvelle méthode, la validation croisée k-fold non redondante, qui garantit que chaque instance est utilisée une seule fois pour l'entraînement et le test tout au long du processus de validation. Cela garantit une utilisation équilibrée des ensembles de données, atténue le surapprentissage dû à la répétition des instances et permet des différences plus nettes dans l'analyse des modèles. Les résultats expérimentaux démontrent que cette méthode maintient des performances hiérarchiques et indépendantes du modèle sur divers ensembles de données, tout en fournissant des estimations de variance plus faibles et en réduisant considérablement les coûts de calcul globaux grâce à l'absence de chevauchement des partitions d'entraînement.

Takeaways, Limitations

Takeaways:
Assure une utilisation équilibrée de l’ensemble de données.
Atténue le surapprentissage dû à la répétition des instances.
Fournit des différences plus claires dans l’analyse de comparaison des modèles.
Il réduit l'estimation de la variance tout en maintenant des performances similaires à la validation croisée traditionnelle en k-fold.
Réduit considérablement les coûts de calcul globaux.
Maintient la structure hiérarchique et est indépendant du modèle.
Limitations:
Cet article ne mentionne pas spécifiquement Limitations. D'autres expériences et analyses sont nécessaires pour vérifier ses performances dans un éventail plus large de situations.
👍