Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

WaveHiT-SR: Red jerárquica de wavelets para una superresolución de imágenes eficiente

Created by
  • Haebom

Autor

Fayaz Ali, Muhammad Zawish, Steven Davy, Radu Timofte

Describir

En este artículo, proponemos WaveHiT-SR, un novedoso método de superresolución (SR) de imágenes que integra la transformada wavelet en un marco de transformación jerárquica. Para superar el limitado rango receptivo de los métodos de SR basados ​​en transformadores existentes, empleamos ventanas jerárquicas adaptativas en lugar de ventanas fijas y pequeñas para capturar características a varios niveles y mejorar la capacidad de modelar dependencias de largo alcance. Además, utilizamos la transformada wavelet para descomponer imágenes en múltiples bandas de frecuencia, preservando los detalles estructurales y centrándonos en las características globales y locales. El procesamiento jerárquico permite la reconstrucción progresiva de imágenes de alta resolución, reduciendo la complejidad computacional y minimizando la degradación del rendimiento. Demostramos la eficacia y la eficiencia de WaveHiT-SR mediante experimentos exhaustivos, y demostramos que las versiones mejoradas de SwinIR-Light, SwinIR-NG y SRFormer-Light logran una mayor eficiencia (menos parámetros, menos FLOP y mayor velocidad) y resultados de SR de vanguardia.

Takeaways, Limitations

Takeaways:
Demostramos que la combinación de ventanas jerárquicas adaptativas y transformadas wavelet puede mejorar el rendimiento de la súper resolución de imágenes y al mismo tiempo reducir la complejidad computacional.
Logra una mayor eficiencia (menos parámetros, menores FLOP, mayor velocidad) que los excelentes modelos SR basados ​​en transformadores existentes.
Genere imágenes de alta resolución y preserve mejor los detalles mediante la extracción de características en múltiples bandas de frecuencia.
Limitations:
Existe la posibilidad de que el rendimiento del método propuesto esté sesgado hacia ciertos tipos de imágenes o conjuntos de datos.
El rendimiento puede verse afectado por la configuración de los parámetros de la transformada wavelet. Se requiere más investigación para determinar la configuración óptima de los parámetros.
Se necesita un análisis comparativo más completo con otros métodos de SR de última generación.
👍