Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

EZ-Sort: So sánh từng cặp hiệu quả thông qua sắp xếp trước dựa trên Zero-Shot CLIP và sắp xếp theo vòng lặp của con người

Created by
  • Haebom

Tác giả

Park Yujin, Haejun Chung, Ikbeom Jang

Phác thảo

Bài báo này khám phá xu hướng ưu tiên so sánh từng cặp hơn là xếp hạng tuyệt đối hoặc phân loại trình tự để cải thiện độ tin cậy trong các tác vụ chú thích chủ quan hoặc đầy thử thách. Trong khi so sánh từng cặp truyền thống yêu cầu một số lượng lớn chú thích (O(n^2)), nghiên cứu gần đây đã giảm đáng kể gánh nặng chú thích (O(n log n)) bằng cách chủ động lấy mẫu so sánh từng cặp bằng thuật toán căn chỉnh. Trong bài báo này, chúng tôi tiếp tục cải thiện hiệu quả chú thích bằng cách (1) căn chỉnh trước các mục theo thứ bậc bằng mô hình đào tạo trước ngôn ngữ-hình ảnh tương phản (CLIP) mà không cần đào tạo và (2) thay thế các so sánh dễ dàng và rõ ràng của con người bằng các so sánh tự động. EZ-Sort được đề xuất trước tiên tạo ra một căn chỉnh trước zero-shot dựa trên CLIP, sau đó khởi tạo điểm Elo nhận biết nhóm và cuối cùng chạy MergeSort có sự tham gia của con người dựa trên sự không chắc chắn. Chúng tôi đã xác thực phương pháp của mình bằng cách sử dụng nhiều tập dữ liệu khác nhau, bao gồm Ước tính tuổi khuôn mặt (FGNET), Niên đại hình ảnh lịch sử (DHCI) và EyePACS (EyePACS). Kết quả là, EZ-Sort duy trì hoặc cải thiện độ tin cậy giữa các nhà đánh giá, đồng thời giảm 90,5% chi phí chú thích của con người so với so sánh từng cặp đầy đủ và 19,8% (khi n = 100) so với các nghiên cứu hiện có. Những kết quả này chứng minh rằng việc kết hợp thông tin trước đó dựa trên CLIP và lấy mẫu có tính đến sự không chắc chắn sẽ mang lại một giải pháp xếp hạng từng cặp hiệu quả và có khả năng mở rộng.

Takeaways, Limitations

Takeaways:
Chúng tôi đã cải thiện đáng kể hiệu quả của các tác vụ so sánh từng cặp bằng cách tận dụng phương pháp căn chỉnh trước bằng không và lấy mẫu dựa trên sự không chắc chắn với CLIP.
Chúng tôi đã đạt được mức giảm 90,5% chi phí chú thích so với so sánh từng cặp đầy đủ và giảm 19,8% so với các nghiên cứu hiện có.
Nâng cao hiệu quả trong khi vẫn duy trì hoặc cải thiện độ tin cậy giữa các đánh giá viên.
Chúng tôi đã xác minh hiệu suất tổng quát của phương pháp đề xuất thông qua xác thực trên nhiều tập dữ liệu khác nhau.
Limitations:
ĐIều này phụ thuộc vào hiệu suất của mô hình CLIP và những hạn chế của mô hình CLIP có thể ảnh hưởng đến hiệu suất của EZ-Sort.
Vì độ chính xác của các phép so sánh tự động không phải lúc nào cũng được đảm bảo nên có thể xảy ra lỗi.
Nó có thể được tối ưu hóa cho một loại tập dữ liệu cụ thể và có thể hoạt động kém trên các loại tập dữ liệu khác.
Có thể cần nghiên cứu thêm về khả năng mở rộng cho các tập dữ liệu lớn.
👍