Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

L-MARS: Quy trình làm việc đa tác nhân hợp pháp với lý luận được dàn dựng và tìm kiếm tác nhân

Created by
  • Haebom

Tác giả

Ziqi Wang, Boqin Yuan

Phác thảo

L-MARS là một hệ thống giúp giảm thiểu sự nhầm lẫn và bất định trong việc trả lời câu hỏi pháp lý thông qua suy luận và truy xuất đa tác nhân. Không giống như Hệ thống Tìm kiếm Tăng cường (RAG) một lần, L-MARS phân tích câu hỏi thành các bài toán con, thực hiện tìm kiếm có mục tiêu trên các nguồn khác nhau (web Serper, RAG địa phương, án lệ CourtListener) và sử dụng các tác nhân thẩm phán để xác thực tính đầy đủ, thẩm quyền và hiệu lực tạm thời trước khi tổng hợp câu trả lời. Vòng lặp suy luận-truy xuất-xác minh lặp đi lặp lại này đảm bảo tính nhất quán, lọc bỏ bằng chứng nhiễu và đưa câu trả lời vào khuôn khổ luật có thẩm quyền. Chúng tôi đã đánh giá L-MARS trên LegalSearchQA, một chuẩn mực mới bao gồm 200 câu hỏi pháp lý trắc nghiệm hiện đại từ năm 2025. Kết quả chứng minh rằng L-MARS cải thiện đáng kể độ chính xác về mặt thực tế, giảm thiểu sự bất định và đạt được điểm ưu tiên cao hơn cho cả chuyên gia con người và thẩm phán có bằng Thạc sĩ Luật (LLM). Nghiên cứu này chứng minh rằng lý luận đa tác nhân thông qua tìm kiếm tác nhân cung cấp một bản thiết kế có khả năng mở rộng và tái tạo để triển khai LLM trong các lĩnh vực có rủi ro cao đòi hỏi phải tìm kiếm và cân nhắc pháp lý chính xác.

Takeaways, Limitations

Takeaways:
Cải thiện độ chính xác và độ tin cậy của việc trả lời câu hỏi pháp lý thông qua suy luận đa tác nhân và tìm kiếm tác nhân.
Cung cấp khuôn khổ có khả năng mở rộng và tái tạo để áp dụng LLM vào các lĩnh vực có rủi ro cao (lĩnh vực pháp lý).
Thu thập thông tin hiệu quả và lọc bằng chứng bằng cách sử dụng các nguồn dữ liệu không đồng nhất.
ĐIểm đánh giá cao từ cả chuyên gia và giám khảo có bằng LLM.
Limitations:
ĐIểm chuẩn LegalSearchQA tương đối nhỏ (200 câu hỏi).
Thiếu phân tích so sánh hiệu suất của L-MARS với các hệ thống trả lời câu hỏi pháp lý khác.
Cần phải áp dụng và xác minh hiệu suất của L-MARS trong môi trường pháp lý thực tế.
Thiếu giải thích chi tiết về tiêu chí đánh giá và thuật toán của thẩm phán.
👍