Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

MoSEs: Phát hiện văn bản do AI tạo ra có nhận thức về sự không chắc chắn thông qua sự kết hợp của các chuyên gia về phong cách với ngưỡng có điều kiện

Created by
  • Haebom

Tác giả

Junxi Wu, Jinpeng Wang, Zheng Liu, Bin Chen, Dongjian Hu, Hao Wu, Shu-Tao Xia

Phác thảo

Bài báo này nhấn mạnh tầm quan trọng của việc xây dựng một hệ thống phát hiện văn bản do AI tạo ra đáng tin cậy, trong bối cảnh ngày càng lo ngại về việc lạm dụng tiềm ẩn các mô hình ngôn ngữ quy mô lớn. Chúng tôi nhấn mạnh những hạn chế của các phương pháp hiện có, vốn bỏ qua mô hình hóa phong cách và dựa vào ngưỡng tĩnh, làm hạn chế đáng kể hiệu suất phát hiện. Chúng tôi đề xuất khuôn khổ Hỗn hợp các Chuyên gia Phong cách (MoSEs), cho phép ước tính ngưỡng có điều kiện để định lượng sự không chắc chắn nhận biết phong cách. MoSEs bao gồm ba thành phần cốt lõi: Kho Tham chiếu Phong cách (SRR), Bộ Định tuyến Nhận biết Phong cách (SAR) và Bộ Ước tính Ngưỡng Có Điều kiện (CTE). Đối với văn bản đầu vào, SRR kích hoạt dữ liệu tham chiếu phù hợp và cung cấp cho CTE, sau đó CTE sẽ tự động xác định ngưỡng tối ưu bằng cách kết hợp mô hình hóa các đặc điểm thống kê ngôn ngữ và ngữ nghĩa. MoSEs tạo ra các nhãn dự đoán với điểm số phân biệt và mức độ tin cậy tương ứng, đạt được mức cải thiện trung bình 11,34% về hiệu suất phát hiện so với các phương pháp hiện có và cải thiện 39,15% trong môi trường tài nguyên thấp. Mã nguồn có sẵn trên GitHub.

Takeaways, Limitations

Takeaways:
Một khuôn khổ mới (MoSE) được trình bày để cải thiện hiệu suất phát hiện văn bản do AI tạo ra thông qua định lượng sự không chắc chắn theo phong cách.
ĐạT được mức cải thiện hiệu suất trung bình là 11,34% so với các phương pháp hiện có và 39,15% trong môi trường có ít tài nguyên.
Phát hiện chính xác hơn thông qua cài đặt ngưỡng động
ĐảM bảo khả năng tái tạo và khả năng mở rộng thông qua việc tiết lộ mã nguồn
Limitations:
Khả năng suy giảm hiệu suất tùy thuộc vào kích thước và cấu hình của SRR
Cần xác minh hiệu suất tổng quát trên nhiều phong cách và ngôn ngữ khác nhau
Cần đánh giá khả năng thích ứng cho các phong cách văn bản mới do AI tạo ra
Tiềm năng tăng chi phí tính toán do tính phức tạp của CTE
👍