Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Validación cruzada irredunda de $k$ pliegues

Created by
  • Haebom

Autor

Jesús S. Aguilar-Ruiz

Describir

La validación cruzada k-fold convencional presenta el problema de usar cada instancia para entrenamiento (k-1) veces y prueba una sola vez, lo que resulta en redundancia y un impacto desproporcionado en el proceso de aprendizaje debido a múltiples instancias. En este artículo, presentamos un método novedoso, la validación cruzada k-fold irredundante, que garantiza que cada instancia se use tanto para entrenamiento como para prueba exactamente una vez durante todo el proceso de validación. Esto garantiza un uso equilibrado del conjunto de datos, mitiga el sobreajuste debido a la repetición de instancias y permite diferencias más claras en el análisis de modelos. Los resultados experimentales demuestran que este método mantiene un rendimiento jerárquico e independiente del modelo en diversos conjuntos de datos, a la vez que proporciona estimaciones de varianza más bajas y reduce significativamente los costos computacionales generales gracias a la no superposición de particiones de entrenamiento.

Takeaways, Limitations

Takeaways:
Garantiza una utilización equilibrada del conjunto de datos.
Mitiga el sobreajuste debido a la repetición de instancias.
Proporciona diferencias más claras en el análisis de comparación de modelos.
Reduce la estimación de la varianza manteniendo un rendimiento similar al de la validación cruzada tradicional de k pliegues.
Reduce significativamente los costos computacionales generales.
Mantiene la estructura jerárquica y es independiente del modelo.
Limitations:
Este artículo no menciona específicamente Limitations. Se requieren más experimentos y análisis para verificar su rendimiento en una gama más amplia de situaciones.
👍