Este artículo propone RIDGECUT, un nuevo marco para aplicar el aprendizaje por refuerzo (AR) a problemas de optimización combinatoria, específicamente al problema de Corte Normalizado. Para abordar la dificultad de incorporar el conocimiento del dominio, una limitación de los métodos existentes basados en AR, proponemos un método que aprovecha dicho conocimiento para restringir el espacio de acción. Tomando como ejemplo una red vial urbana, transformamos el grafo en una estructura lineal o circular mediante estructuras viales concéntricas y radiales, y realizamos un aprendizaje eficiente mediante transformadores secuenciales. Como resultado, logramos valores de Corte Normalizado más bajos que los métodos existentes y generamos particiones que se ajustan estrechamente a la disposición espacial. Si bien esta investigación se centra en datos de tráfico, proporcionamos un mecanismo general para incorporar el conocimiento estructural previo sobre problemas de partición de grafos en el AR.