Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới. Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận. Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.
MSC: Bộ dữ liệu video về động vật hoang dã biển với phân đoạn thực tế và chú thích cấp độ clip
Created by
Haebom
Tác giả
Quang-Trung Trường, Yuk-Kwan Wong, Võ Hoàng Kim Tuyên Đặng, Rinaldi Gotama, Đức Thành Nguyễn, Sai-Kit Yeung
Phác thảo
Bài báo này đề cập đến thách thức trong việc hiểu hình ảnh biển, vốn bị cản trở bởi bản chất động của môi trường biển, chuyển động của máy ảnh và sự phức tạp của các cảnh dưới nước. Các tập dữ liệu chú thích hình ảnh hiện có thường tập trung vào các lĩnh vực chung hoặc lấy con người làm trung tâm, không thể khái quát hóa thành sự phức tạp của môi trường biển và cung cấp thông tin chi tiết về sinh vật biển. Để giải quyết những hạn chế này, bài báo này đề xuất một quy trình chú thích hình ảnh hướng đối tượng biển hai giai đoạn. Chúng tôi giới thiệu một chuẩn mực hiểu hình ảnh toàn diện tận dụng ba yếu tố—hình ảnh, văn bản và mặt nạ phân đoạn—để tạo điều kiện cho việc căn chỉnh trực quan và tạo chú thích. Điều này nâng cao khả năng hiểu và phân tích hình ảnh biển, cũng như tạo hình ảnh biển. Hơn nữa, chúng tôi nhấn mạnh hiệu quả của việc phân đoạn hình ảnh trong việc phát hiện các chuyển đổi đối tượng quan trọng qua các thay đổi của cảnh, làm phong phú đáng kể ngữ nghĩa của nội dung chú thích. Tập dữ liệu và mã được công khai tại https://msc.hkustvgd.com .