En este artículo, proponemos una técnica de modulación de atención dinámica de frecuencia (FDAM) para resolver el problema de pérdida de frecuencia, que es un importante Limitations de los transformadores de visión (ViTs). El mecanismo de atención existente de los ViTs actúa como un filtro paso bajo, lo que causa la pérdida de información detallada y textura, mientras que FDAM modula directamente la respuesta de frecuencia de los ViTs mediante dos técnicas: inversión de atención (AttInv), que genera filtrado de alta frecuencia invirtiendo la matriz de atención, y escalamiento dinámico de frecuencia (FreqScale), que pondera varios componentes de frecuencia. Demuestra una mejora del rendimiento en varios modelos como SegFormer, DeiT y MaskDINO en tareas como segmentación semántica, detección de objetos y segmentación de instancias, y logra un rendimiento de vanguardia en el campo de la detección por teledetección en particular.