Este artículo propone un nuevo mecanismo de atención, denominado Atención de Filtro Adaptativo (AFA). AFA integra directamente un modelo dinámico aprendible en el cálculo de las ponderaciones de atención. En lugar de comparar directamente consultas y claves, modela la secuencia de entrada como observaciones discretas de una ecuación diferencial estocástica (EDE) lineal. Simultáneamente, al aplicar un modelo dinámico lineal con una matriz de estados diagonalizable y covarianza de ruido, propaga eficientemente la incertidumbre mutua dinámica utilizando la solución en forma cerrada de la ecuación diferencial de Lyapunov. La atención surge naturalmente como una solución de máxima verosimilitud para esta EDE lineal, y las ponderaciones de atención corresponden a una reponderación residual robusta basada en la precisión mutua propagada. La imposición de restricciones adicionales a los autovalores de la matriz de estados produce una variante simplificada con la misma complejidad computacional y de memoria que la atención estándar. Al emplear una aproximación de ángulo pequeño y limitar la desaparición de elementos dinámicos y ruido de proceso, es posible recuperar la atención típica del producto interno.