CaSTFormer es un modelo de predicción de la intención de conducción que mejora la seguridad y la eficiencia de la interacción en sistemas de conducción cooperativa hombre-máquina. Su objetivo es superar las limitaciones de los modelos existentes para modelar con precisión las complejas interdependencias espaciotemporales y la variabilidad impredecible del comportamiento humano al volante. CaSTFormer introduce el mecanismo de fusión de retropropagación recíproca (RSF), el módulo de extracción de patrones causales (CPE) y la red de síntesis de características (FSN) para modelar explícitamente la relación causal entre el comportamiento del conductor y el contexto ambiental, logrando así una alineación temporal precisa, la eliminación de falsas correlaciones y una síntesis de representación consistente para la inferencia espaciotemporal. Alcanza un rendimiento de vanguardia en el conjunto de datos Brain4Cars y captura eficazmente las complejas dependencias espaciotemporales causales, mejorando así la precisión y la transparencia de la predicción de la intención de conducción.