Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Nhận dạng thuộc tính người đi bộ dựa trên sự kiện RGB: Bộ dữ liệu chuẩn và Khung kết hợp RWKV không đối xứng

Created by
  • Haebom

Tác giả

Xiao Wang, Haiyang Wang, Shiao Wang, Qiang Chen, Jiandong Jin, Haoyu Song, Bo Jiang, Chenglong Li

Phác thảo

Các phương pháp nhận dạng thuộc tính người đi bộ hiện có đã được phát triển dựa trên camera RGB, nhưng chúng dễ bị ảnh hưởng bởi điều kiện ánh sáng và độ mờ chuyển động, đồng thời có những hạn chế trong việc xem xét các khía cạnh cảm xúc. Bài báo này đề xuất một nhiệm vụ nhận dạng thuộc tính người đi bộ theo sự kiện RGB đa phương thức sử dụng camera sự kiện, có hiệu suất ánh sáng yếu, tốc độ cao và mức tiêu thụ điện năng thấp. Chúng tôi phát hành EventPAR, một tập dữ liệu nhận dạng thuộc tính người đi bộ đa phương thức quy mô lớn chứa 100.000 mẫu sự kiện RGB và bao gồm 50 thuộc tính liên quan đến ngoại hình và sáu cảm xúc. Chúng tôi đào tạo lại và đánh giá các mô hình PAR hiện có để thiết lập điểm chuẩn và đề xuất một khuôn khổ nhận dạng thuộc tính người đi bộ đa phương thức dựa trên RWKV. Các kết quả tiên tiến nhất đạt được thông qua các thử nghiệm trên tập dữ liệu được đề xuất, MARS-Attribute và các tập dữ liệu mô phỏng DukeMTMC-VID-Attribute. Mã nguồn và tập dữ liệu sẽ được cung cấp trên GitHub.

Takeaways, Limitations

Takeaways:
Trình bày những khả năng mới trong việc nhận dạng thuộc tính người đi bộ đa phương thức bằng camera sự kiện.
Phát hành và đánh giá chuẩn của EventPAR, một bộ dữ liệu nhận dạng thuộc tính người đi bộ đa phương thức quy mô lớn
Đề Xuất và kiểm chứng hiệu suất của một khuôn khổ nhận dạng thuộc tính người đi bộ đa phương thức mới dựa trên RWKV
ĐặT nền tảng cho nghiên cứu về nhận dạng thuộc tính của người đi bộ, không chỉ xem xét ngoại hình mà còn cả cảm xúc.
_____T39333____:
Cần phải xác thực thêm về hiệu suất đa dạng và tổng quát của tập dữ liệu EventPAR.
Khung dựa trên RWKV được đề xuất yêu cầu phân tích so sánh nâng cao với các mô hình khác.
Cần phải đánh giá hiệu suất và phân tích độ mạnh mẽ trong môi trường thực tế.
👍