Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Thực hành: Phân đoạn các dấu hiệu riêng lẻ từ các chuỗi liên tục

Created by
  • Haebom

Tác giả

JianHe Low, Harry Walsh, Ozge Mercanoglu Sincan, Richard Bowden

Phác thảo

Bài báo này đề cập đến vấn đề phân đoạn ngôn ngữ ký hiệu liên tục, một thách thức quan trọng trong dịch thuật ngôn ngữ ký hiệu và chú thích dữ liệu. Chúng tôi đề xuất một kiến ​​trúc dựa trên bộ biến đổi, mô hình hóa động lực học thời gian và định nghĩa phân đoạn khung như một bài toán gắn nhãn chuỗi bằng phương pháp gắn nhãn Begin-In-Out (BIO). Chúng tôi tận dụng các đặc trưng bàn tay HaMeR và bổ sung chúng bằng các góc 3D. Kết quả thực nghiệm chứng minh rằng mô hình đề xuất đạt hiệu suất tiên tiến trên kho ngữ liệu DGS, và các đặc trưng đề xuất vượt trội hơn các chuẩn mực hiện có trên kho ngữ liệu BSL.

Takeaways, Limitations

Takeaways:
ĐạT được hiệu suất tiên tiến nhất trong phân đoạn ngôn ngữ ký hiệu bằng cách sử dụng kiến ​​trúc dựa trên bộ chuyển đổi.
Một phương pháp trích xuất tính năng mới kết hợp các tính năng bàn tay HaMeR và góc 3D được trình bày.
Xác thực hiệu suất tuyệt vời trên ngữ liệu DGS và ngữ liệu BSL.
Limitations:
Chỉ có các đánh giá hiệu suất cho các tập đoàn ngôn ngữ ký hiệu cụ thể (DGS, BSL) được trình bày, đòi hỏi phải nghiên cứu thêm về khả năng khái quát hóa.
Thiếu phân tích về chi phí tính toán và hiệu quả của mô hình đề xuất.
Cần phải xác minh khả năng mở rộng cho nhiều ngôn ngữ ký hiệu và tập dữ liệu khác nhau.
👍