[공지사항]을 빙자한 안부와 근황 
Show more

Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

KeyRe-ID: Nhận dạng lại người theo điểm chính bằng cách sử dụng biểu diễn nhận biết một phần trong video

Created by
  • Haebom

Tác giả

Jinseong Kim, Jeonghoon Song, Gyeongseon Baek, Byeongjoon Noh

Phác thảo

KeyRe-ID là một khuôn khổ nhận dạng lại người dựa trên video, tận dụng các điểm chính, thực hiện học tập biểu diễn không gian-thời gian nâng cao thông qua các nhánh toàn cục và cục bộ. Nhánh toàn cục nắm bắt ngữ nghĩa nhận dạng tổng thể thông qua tổng hợp thời gian dựa trên Transformer, trong khi nhánh cục bộ phân đoạn động các vùng cơ thể dựa trên các điểm chính để tạo ra các đặc điểm nhận dạng chi tiết. Các thử nghiệm mở rộng trên các chuẩn MARS và iLIDS-VID đã chứng minh hiệu suất vượt trội, đạt 91,73% mAP và 97,32% độ chính xác Hạng 1 trên MARS, và 96,00% độ chính xác Hạng 1 và 100,0% Hạng 5 trên iLIDS-VID. Chúng tôi sẽ phát hành mã nguồn trên GitHub sau khi phát hành công khai.

Takeaways, Limitations

Takeaways:
Chúng tôi cải thiện đáng kể hiệu suất nhận dạng lại người dựa trên video bằng cách học các biểu diễn không gian thời gian dựa trên điểm chính.
Tận dụng hiệu quả thông tin nhận dạng toàn diện và thông tin phân khúc chi tiết thông qua sự kết hợp giữa các chi nhánh toàn cầu và khu vực.
ĐạT được hiệu suất tiên tiến nhất trên các tiêu chuẩn MARS và iLIDS-VID.
Việc công khai mã nguồn mở làm tăng khả năng tái tạo và khả năng sử dụng của nghiên cứu.
Limitations:
Vì chỉ trình bày hiệu suất trên các tập dữ liệu chuẩn cụ thể nên hiệu suất tổng quát cho các tập dữ liệu khác cần được nghiên cứu thêm.
Hiệu suất có thể phụ thuộc vào độ chính xác của việc trích xuất điểm chính. Cần có các nghiên cứu về độ tin cậy của lỗi trích xuất điểm chính.
Thiếu phân tích về tốc độ xử lý thời gian thực.
👍