Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Phân khúc trước, truy xuất tốt hơn: Tìm kiếm pháp lý thực tế thông qua truy vấn dựa trên vai trò tu từ

Created by
  • Haebom

Tác giả

Shubham Kumar Nigam, Tanmay Dubey, Noel Shallum, Arnab Bhattacharya

Phác thảo

TraceRetriever là một hệ thống truy xuất tiền lệ pháp lý hoạt động với thông tin vụ án hạn chế, chỉ trích xuất những phần quan trọng trong quá trình điều tra thay vì yêu cầu toàn bộ tài liệu, do đó phản ánh các tìm kiếm pháp lý trong thế giới thực. Hệ thống tích hợp BM25, một cơ sở dữ liệu vector, và một mô hình mã hóa chéo để kết hợp các kết quả ban đầu thông qua hợp nhất thứ hạng qua lại, sau đó là xếp hạng lại cuối cùng. Hệ thống tạo ra các chú thích điều tra bằng cách sử dụng bộ phân loại BiLSTM CRF phân cấp được đào tạo dựa trên các phán quyết của Ấn Độ. Được đánh giá trên các bộ dữ liệu IL-PCR và COLIEE 2025, TraceRetriever giải quyết khối lượng tài liệu ngày càng tăng đồng thời nâng cao nghiên cứu pháp lý bằng cách cung cấp một nền tảng truy xuất tiền lệ pháp lý đáng tin cậy và có khả năng mở rộng ngay cả khi chỉ có một phần thông tin vụ án, đáp ứng các ràng buộc tìm kiếm trong thế giới thực.

Takeaways, Limitations

Takeaways:
Chứng minh rằng việc tìm kiếm tiền lệ pháp lý hiệu quả là có thể ngay cả khi thông tin về vụ án còn hạn chế.
Trình bày phương pháp phù hợp với môi trường tìm kiếm pháp lý trong thế giới thực.
Tích hợp hiệu quả BM25, cơ sở dữ liệu vector và các mô hình mã hóa chéo.
Cung cấp giải pháp thực tế để tìm kiếm khối lượng lớn tài liệu pháp lý.
Hỗ trợ nghiên cứu pháp lý đáng tin cậy chỉ với thông tin một phần của vụ án.
Limitations:
Bộ dữ liệu được sử dụng chỉ giới hạn ở các phán quyết từ một khu vực cụ thể (Ấn Độ).
Cần nghiên cứu thêm để xác định khả năng áp dụng chung cho các hệ thống pháp luật và ngôn ngữ khác.
Cần phải xác nhận thêm hiệu suất của mô hình tạo chú thích điều tra.
Cần có các nghiên cứu so sánh với các phương pháp hợp nhất khác ngoài phương pháp hợp nhất bậc tương hỗ.
👍