Este artículo propone un novedoso enfoque de ruta corta para resolver las limitaciones de memoria y computación del aprendizaje en el dispositivo. Basándonos en el método existente de descomposición de bajo rango, proponemos un método para reducir el uso de memoria y el total de FLOP de entrenamiento, al mitigar el cuello de botella de la memoria de activación en el proceso de retropropagación. Los resultados experimentales muestran que el uso de la memoria de activación se reduce hasta 120,09 veces y los FLOP hasta 1,86 veces, en comparación con los métodos existentes. Esto sugiere que la eficiencia del aprendizaje en el dispositivo puede mejorarse considerablemente.