Este artículo explora el potencial de la inteligencia artificial explicable (XAI) en el campo de la bioacústica. Para analizar los sonidos de las aves, que presentan una variación geográfica significativa en Norteamérica, transformamos las señales acústicas en imágenes de espectrogramas y entrenamos un modelo de clasificación mediante una red neuronal convolucional (CNN) profunda. Para interpretar las predicciones del modelo, que alcanzaron una precisión del 94,8 %, aplicamos técnicas de XAI como LIME, SHAP, DeepLIFT y Grad-CAM, e integramos los resultados de diferentes técnicas para obtener información más completa e interpretable. Demostramos que la combinación de diversas técnicas de XAI puede mejorar la fiabilidad y la interoperabilidad del modelo, lo que sugiere que este enfoque puede aplicarse a otras tareas específicas del dominio.