Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Khung kiểm duyệt nội dung hợp tác để phát hiện độc tính dựa trên ước tính chuẩn hóa về sự không đồng thuận trong chú thích

Created by
  • Haebom

Tác giả

Guillermo Villate-Castillo, Javier Del Ser, Borja Sanz

Phác thảo

Bài báo này trình bày một khuôn khổ mới tận dụng sự không nhất quán của chú thích trong quá trình kiểm duyệt nội dung. Các hệ thống kiểm duyệt nội dung hiện có kết hợp người kiểm duyệt với các mô hình học máy, nhưng có xu hướng coi sự không nhất quán của chú thích là nhiễu. Bài báo này diễn giải những sự không nhất quán này như những tín hiệu có giá trị cho thấy sự mơ hồ của nội dung và trình bày một phương pháp học đồng thời phân loại độc tính và sự không nhất quán của chú thích thông qua học đa tác vụ. Cụ thể, phương pháp này tận dụng dự đoán phù hợp để tính đến sự mơ hồ của chú thích và độ không chắc chắn của mô hình, cung cấp cho người kiểm duyệt sự linh hoạt để điều chỉnh ngưỡng cho sự không nhất quán của chú thích. Kết quả thực nghiệm cho thấy khuôn khổ được đề xuất cải thiện hiệu suất mô hình, hiệu chuẩn và ước tính độ không chắc chắn so với các phương pháp tiếp cận đơn tác vụ, tăng hiệu quả tham số và cải thiện quy trình đánh giá.

Takeaways, Limitations

Takeaways:
Chúng tôi chứng minh rằng sự không nhất quán trong chú thích có thể được sử dụng làm thông tin có giá trị trong việc kiểm duyệt nội dung để cải thiện hiệu suất mô hình.
Chúng tôi đề xuất rằng việc kết hợp học tập đa nhiệm vụ và các kỹ thuật ước tính sự không chắc chắn có thể tạo ra một hệ thống kiểm duyệt nội dung chính xác và đáng tin cậy hơn.
Cải thiện quy trình đánh giá nội dung và tăng hiệu quả bằng cách cung cấp sự linh hoạt cho người kiểm duyệt.
Hiệu quả tham số được cải thiện cho phép sử dụng tài nguyên hệ thống hiệu quả hơn.
Limitations:
Cần nghiên cứu thêm để xác định tính tổng quát của khuôn khổ đề xuất và khả năng áp dụng của nó cho nhiều loại nội dung khác nhau.
Cần nghiên cứu thêm về các chiến lược tối ưu hóa để thiết lập ngưỡng cho sự không khớp chú thích.
Cần phải đánh giá hiệu suất và khả năng mở rộng trong môi trường dịch vụ thực tế.
👍