Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

MF-LPR$^2$: Khôi phục và nhận dạng hình ảnh biển số xe đa khung bằng luồng quang học

Created by
  • Haebom

Tác giả

Kihyun Na, Junseok Oh, Youngkwan Cho, Bumjin Kim, Sungmin Cho, Jinyoung Choi, Injung Kim

Phác thảo

Bài báo này đề xuất một khuôn khổ đa khung mới, MF-LPR$^2$, để khôi phục và nhận dạng vùng biển số xe trong video camera hành trình, nơi việc nhận dạng biển số xe chính xác gặp khó khăn do độ phân giải thấp, hiện tượng nhòe chuyển động và lóa sáng. Để giải quyết vấn đề các mô hình được đào tạo trước hiện có tạo ra hiện tượng nhiễu và biến dạng nghiêm trọng khi khôi phục ảnh chất lượng thấp, MF-LPR$^2$ giải quyết sự mơ hồ của ảnh chất lượng thấp bằng cách căn chỉnh và tổng hợp các khung hình lân cận thay vì dựa vào kiến ​​thức đã được đào tạo trước. Chúng tôi sử dụng một bộ ước lượng luồng quang học tiên tiến để căn chỉnh khung hình chính xác và thiết kế một thuật toán tận dụng tính nhất quán không gian-thời gian của chuỗi ảnh biển số xe để phát hiện và hiệu chỉnh các ước lượng luồng quang học không chính xác. Kết quả thử nghiệm cho thấy MF-LPR$^2$ vượt trội đáng kể so với tám mô hình phục hồi hiện đại về PSNR, SSIM và LPIPS, đạt độ chính xác nhận dạng 86,44%, vượt trội so với cả LPR một khung hình tốt nhất (14,04%) và LPR nhiều khung hình tốt nhất (82,55%) trong số 11 mô hình cơ sở. Chúng tôi đã đánh giá MF-LPR$^2$ bằng cách xây dựng một bộ dữ liệu LPR Thực tế (RLPR) mới.

Takeaways, Limitations

Takeaways:
Một khuôn khổ đa khung mới, MF-LPR$^2$, cải thiện đáng kể độ chính xác khi nhận dạng biển số xe trong cảnh quay từ camera hành trình chất lượng thấp.
Giải quyết sự mơ hồ trong hình ảnh chất lượng thấp thông qua việc căn chỉnh và tổng hợp khung dựa trên luồng quang học mà không cần dựa vào kiến ​​thức được đào tạo trước.
ĐạT được chất lượng hình ảnh được cải thiện và độ chính xác nhận dạng
Xây dựng bộ dữ liệu RLPR mới phản ánh sự phức tạp của môi trường thực tế.
Limitations:
Bộ dữ liệu RLPR tương đối nhỏ, chỉ bao gồm 200 cặp. Cần đánh giá bằng bộ dữ liệu đa dạng và lớn hơn.
Cần phải phân tích và tối ưu hóa độ phức tạp tính toán của thuật toán.
Hiệu suất có thể giảm sút trong một số điều kiện nhất định (ví dụ: chuyển động mạnh, phản xạ ánh sáng mạnh).
👍