Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo. La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro. Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.
Modulación de frecuencia espacial para la segmentación semántica
Created by
Haebom
Autor
Linwei Chen, Ying Fu, Lin Gu, Dezhi Zheng, Jifeng Dai
Describir
Este artículo señala que, si bien la información espacial de alta frecuencia (p. ej., la textura fina) contribuye significativamente a la precisión de la segmentación semántica, los componentes de alta frecuencia pueden presentar alias o distorsión al pasar por capas de submuestreo, como la convolución a pasos, debido al teorema de muestreo de Nyquist-Shannon. Para abordar este problema, proponemos una novedosa técnica de modulación de frecuencia espacial (SFM) que modula las características de alta frecuencia a frecuencias más bajas antes del submuestreo y luego las demodula de nuevo durante el sobremuestreo. Implementamos la modulación mediante remuestreo adaptativo (ARS) y diseñamos un complemento ligero que expande la señal muestreando densamente la región de alta frecuencia y luego reduce la frecuencia según la propiedad de escalado de frecuencia. Además, proponemos el sobremuestreo adaptativo multiescala (MSAU) para demodular las características moduladas y recuperar la información de alta frecuencia mediante un sobremuestreo no uniforme. Este módulo mejora la segmentación al explotar explícitamente la interacción de información entre regiones densas y escasamente remuestreadas a múltiples escalas. Ambos módulos se integran perfectamente con diversas arquitecturas, desde redes neuronales convolucionales hasta transformadores. Mediante la visualización y el análisis de características, verificamos que el método propuesto mitiga eficazmente el aliasing, preservando los detalles incluso después de la demodulación. Finalmente, extendemos el SFM a tareas de clasificación de imágenes, robustez adversarial, segmentación de instancias y segmentación de panoramas para verificar su amplia aplicabilidad y eficacia. El código se encuentra en https://github.com/Linwei-Chen/SFM .
Se presenta una nueva técnica SFM para resolver eficazmente el problema de la pérdida de información de alta frecuencia que ocurre durante el submuestreo.
◦
Reduzca el aliasing y la distorsión de la información de alta frecuencia y preserve los detalles mediante módulos de remuestreo adaptativo (ARS) y sobremuestreo adaptativo multiescala (MSAU).
◦
Garantiza una amplia aplicabilidad mediante la compatibilidad con diversas arquitecturas (CNN, Transformer).
◦
Se demostraron mejoras de rendimiento en una variedad de tareas, incluidas la clasificación de imágenes, la robustez adversarial, la segmentación de instancias y la segmentación de panoramas.
•
Limitations:
◦
Falta de análisis detallado del costo computacional y el uso de memoria del método propuesto.
◦
Los resultados experimentales en varios conjuntos de datos pueden ser limitados.
◦
Falta de una explicación detallada de la optimización de hiperparámetros de los módulos ARS y MSAU.