Este artículo aborda el problema de la fuga de datos, que surge de la creciente accesibilidad del aprendizaje automático (AA) y el creciente uso de interfaces intuitivas que no requieren conocimientos especializados y se basan únicamente en enfoques de "pulsar un botón". La fuga de datos se produce cuando los datos de entrenamiento contienen información no deseada que afecta las evaluaciones del rendimiento del modelo, lo que puede dar lugar a estimaciones de rendimiento incorrectas. Este artículo categoriza la fuga de datos en AA y analiza cómo se propaga a través de los flujos de trabajo de AA en condiciones específicas. Además, investigamos la asociación entre la fuga de datos y tareas específicas, examinamos su incidencia en el aprendizaje por transferencia y comparamos el AA inductivo estándar con los marcos de AA transferibles. Finalmente, destacamos la importancia de abordar la fuga de datos para lograr aplicaciones de AA robustas y fiables.