Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

MF-LPR$^2$ : Restauration et reconnaissance d'images de plaques d'immatriculation multi-images à l'aide du flux optique

Created by
  • Haebom

Auteur

Kihyun Na, Junseok Oh, Youngkwan Cho, Bumjin Kim, Sungmin Cho, Jinyoung Choi, Injung Kim

Contour

Cet article propose un nouveau cadre multi-images, MF-LPR$^2$, pour la restauration et la reconnaissance des zones de plaques d'immatriculation dans les vidéos de caméras embarquées, où la reconnaissance précise des plaques est difficile en raison de la faible résolution, du flou de mouvement et des reflets. Pour résoudre le problème des artefacts et distorsions importants générés par les modèles pré-entraînés existants lors de la restauration d'images de mauvaise qualité, MF-LPR$^2$ résout l'ambiguïté des images de mauvaise qualité en alignant et en agrégeant les images voisines au lieu de s'appuyer sur des connaissances pré-entraînées. Nous utilisons un estimateur de flux optique de pointe pour un alignement précis des images et concevons un algorithme qui exploite la cohérence spatio-temporelle des séquences d'images de plaques d'immatriculation pour détecter et corriger les estimations de flux optique incorrectes. Les résultats expérimentaux montrent que MF-LPR$^2$ surpasse significativement huit modèles de restauration de pointe en termes de PSNR, SSIM et LPIPS, et atteint une précision de reconnaissance de 86,44 %, surpassant à la fois le meilleur LPR mono-image (14,04 %) et le meilleur LPR multi-images (82,55 %) parmi 11 modèles de base. Nous avons évalué MF-LPR$^2$ en construisant un nouvel ensemble de données LPR réaliste (RLPR).

Takeaways, Limitations

Takeaways:
Un nouveau cadre basé sur plusieurs images, MF-LPR$^2$, améliore considérablement la précision de la reconnaissance des plaques d'immatriculation dans les séquences de caméra de tableau de bord de faible qualité.
Résolution de l'ambiguïté dans les images de faible qualité grâce à l'alignement et à l'agrégation de trames basés sur le flux optique sans s'appuyer sur des connaissances pré-entraînées.
Obtenir une qualité d'image et une précision de reconnaissance améliorées
Création d’un nouvel ensemble de données RLPR qui reflète la complexité des environnements du monde réel.
Limitations:
L'ensemble de données RLPR est relativement restreint, ne comprenant que 200 paires. Une évaluation à l'aide d'un ensemble de données plus diversifié et plus vaste est nécessaire.
L’analyse et l’optimisation de la complexité de calcul de l’algorithme sont nécessaires.
Dégradation possible des performances dans certaines conditions (par exemple, mouvement extrême, réflexion lumineuse importante).
👍