Este artículo presenta los resultados de una revisión sistemática de la literatura sobre el análisis de informes de errores basado en aprendizaje automático (AA). Se revisaron 1825 artículos y se analizaron 204 de ellos en profundidad. Resumimos los resultados del análisis en siete hallazgos principales: el uso de algoritmos como CNN, LSTM y kNN; la representación de características mediante Word2Vec y TF-IDF; los métodos de preprocesamiento; los proyectos de software a evaluar; las tareas clave de análisis; y las métricas de evaluación. También sugerimos seis líneas de investigación futuras. En particular, destacamos la falta de modelos avanzados como BERT y la ausencia de pruebas estadísticas rigurosas.