Este artículo se centra en la creciente investigación sobre redes neuronales profundas interpretables mediante árboles de decisión y señala que los árboles de decisión tienen las ventajas de una interpretación sencilla, una rápida velocidad de toma de decisiones y la provisión de clases jerárquicas en comparación con los modelos de clasificación de regresión logística. Sin embargo, los árboles de decisión tienen la desventaja de no poder reutilizar los nodos de decisión, lo cual es una desventaja en comparación con los grafos de decisión. En este artículo, proponemos un paradigma general basado en procesos de Markov para resolver el problema de que los grafos de decisión no se han utilizado comúnmente en el aprendizaje profundo debido a la falta de técnicas de entrenamiento eficientes basadas en gradientes. Esto permite el entrenamiento eficiente de un tipo especial de grafo de decisión llamado grafo neuronal autoorganizado (SONG). En este artículo, presentamos amplios estudios teóricos sobre SONG y resultados experimentales utilizando los conjuntos de datos Letter, Connect4, MNIST, CIFAR y TinyImageNet, y demostramos que funciona tan bien o mejor que los modelos de toma de decisiones existentes.