Este artículo presenta un modelo de clasificación automática de enfermedades cutáneas basado en aprendizaje profundo, basado en un conjunto de datos de más de 50 enfermedades cutáneas diversas, capturadas mediante dispositivos móviles. A diferencia de estudios previos que se centraban principalmente en conjuntos de datos de imágenes microscópicas y un número limitado de tipos de enfermedades, este estudio utiliza un conjunto de datos diverso de enfermedades cutáneas que refleja las condiciones del mundo real para un enfoque más realista. Tras evaluar varias arquitecturas basadas en CNN y Transformers, confirmamos que los modelos Transformer, como el Swin Transformer, capturan eficazmente la información contextual global y demuestran un rendimiento superior. Además, utilizamos Grad-CAM para mejorar la interpretabilidad de las predicciones del modelo y garantizar su transparencia mediante la visualización de regiones clínicamente importantes. Esto allana el camino para la detección y el diagnóstico temprano de enfermedades cutáneas basados en IA, accesibles incluso en entornos con recursos limitados.