Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

SMA: Ai đã nói thế? Kiểm toán rò rỉ thành viên trong hệ thống kiểm soát RAG bán đen

Created by
  • Haebom

Tác giả

Shixuan Sun, Siyuan Liang, Ruoyu Chen, Jianjie Huang, Jingzhi Li, Xiaochun Cao

Phác thảo

Bài báo này đề xuất phương pháp Kiểm toán Tư cách Thành viên Nhận biết Nguồn (SMA) đầu tiên, xác định chính xác nguồn nội dung được tạo ra từ Thế hệ Tăng cường Truy xuất (RAG) và Thế hệ Tăng cường Truy xuất Đa phương thức (MRAG). Để khắc phục những hạn chế của các phương pháp suy luận tư cách thành viên hiện có, vốn không thể xác định chính xác nguồn (dữ liệu học chuyển giao, kết quả tìm kiếm bên ngoài và dữ liệu đầu vào của người dùng) của nội dung được tạo ra do tính phức tạp của hệ thống RAG/MRAG, chúng tôi sử dụng cơ chế ước lượng thuộc tính dựa trên tối ưu hóa bậc không và các kỹ thuật thuộc tính liên phương thức. Cụ thể, chúng tôi sử dụng MLLM để chuyển đổi dữ liệu đầu vào hình ảnh thành văn bản, cho phép suy luận tư cách thành viên dựa trên lịch sử tìm kiếm hình ảnh trong các hệ thống MRAG. Điều này mở ra một góc nhìn mới tập trung vào "nội dung đến từ đâu" thay vì liệu dữ liệu có được "ghi nhớ" hay không.

Takeaways, Limitations

Takeaways:
Một phương pháp mới được trình bày để xác định chính xác nguồn nội dung được tạo ra trong hệ thống RAG/MRAG.
Kiểm toán hiệu quả ngay cả trong môi trường hộp đen bán phần thông qua cơ chế ước tính thuộc tính dựa trên tối ưu hóa bậc không.
Cho phép suy luận thành viên cho bản ghi tìm kiếm hình ảnh trong hệ thống MRAG bằng công nghệ thuộc tính đa phương thức sử dụng MLLM.
Một góc nhìn mới về kiểm tra nguồn gốc dữ liệu.
_____T165373____-:
Việc ước tính thuộc tính dựa trên tối ưu hóa bậc không có thể tốn kém về mặt tính toán vì nó yêu cầu lấy mẫu nhiễu loạn trên quy mô lớn.
Có khả năng mất thông tin trong quá trình chuyển đổi hình ảnh sang văn bản bằng MLLM.
Độ Chính xác và hiệu quả của SMA có thể thay đổi tùy thuộc vào kiến trúc hệ thống RAG/MRAG cụ thể và đặc điểm dữ liệu.
Cần có thêm đánh giá ứng dụng và hiệu suất cho các hệ thống thực tế.
👍