Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

DRWKV : Mise au point sur les bords des objets pour améliorer les images en basse lumière

Created by
  • Haebom

Auteur

Xuecheng Bai, Yuxiang Wang, Boyu Hu, Qinyuan Jie, Chuanzhi Xu, Hongru Xiao, Kechen Li, Vera Chung

Contour

Cet article propose un nouveau modèle, DRWKV (Detailed Receptance Weighted Key Value), pour résoudre le problème de l'amélioration d'image dans des environnements à très faible luminosité. DRWKV sépare efficacement l'éclairage et les structures de bord en intégrant la théorie Global Edge Retinex (GER) proposée, améliorant ainsi la fidélité des bords. De plus, nous introduisons Evolving WKV Attention, un mécanisme de balayage en spirale qui capture la continuité spatiale des bords et modélise mieux les structures irrégulières. De plus, nous concevons un aligneur de spectre bilatéral (Bi-SAB) et un algorithme MS2-Loss personnalisé pour aligner les caractéristiques de luminance et de couleur afin d'améliorer la fluidité visuelle et de réduire les artefacts. Des expériences approfondies sur cinq benchmarks d'amélioration d'image en basse lumière (LLIE) démontrent que DRWKV atteint des performances de pointe en PSNR, SSIM et NIQE tout en maintenant une faible complexité de calcul. De plus, nous démontrons une amélioration des performances en aval sur les tâches de suivi multi-objets en basse lumière, démontrant ainsi sa capacité de généralisation.

Takeaways, Limitations

Takeaways:
En intégrant la théorie GER, nous améliorons considérablement la précision de l’amélioration des images en basse lumière en permettant une séparation efficace de l’éclairage et des structures de bord.
L'attention WKV évolutive modélise efficacement la continuité des bords spatiaux et représente bien les structures irrégulières.
Bi-SAB et MS2-Loss améliorent le naturel visuel et réduisent les artefacts.
Il atteint les meilleures performances dans les mesures PSNR, SSIM et NIQE et montre également des améliorations de performances dans les tâches en aval telles que le suivi multi-objets en basse lumière.
Il maintient une faible complexité de calcul, ce qui le rend adapté aux applications en temps réel.
Limitations:
Dans cet article, seuls les résultats d’un ensemble de données de référence spécifique sont présentés, et les performances de généralisation sur d’autres ensembles de données ou conditions d’éclairage nécessitent une étude plus approfondie.
Une description détaillée du processus spécifique de conception et de réglage des paramètres de la théorie GER et de l'évolution de l'attention WKV peut faire défaut.
Une validation supplémentaire de l’évaluation des performances et de la robustesse dans des environnements d’application réels est nécessaire.
👍