Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Nâng cao khả năng truy xuất tài liệu kỹ thuật cho RAG

Created by
  • Haebom

Tác giả

Songjiang Lai, Tsun-Hin Cheung, Ka-Chun Fung, Kaiwen Xue, Kwan-Ho Lin, Yan-Ming Choi, Vincent Ng, Kin-Man Lam

Phác thảo

Bài báo này trình bày Technical-Embeddings, một khuôn khổ mới để tối ưu hóa việc truy xuất ngữ nghĩa các tài liệu kỹ thuật trong phát triển phần cứng và phần mềm. Nó tập trung vào việc giải quyết các thách thức trong việc hiểu và truy xuất nội dung kỹ thuật phức tạp bằng cách tận dụng các mô hình ngôn ngữ quy mô lớn (LLM). Nó mở rộng các truy vấn của người dùng để nắm bắt tốt hơn ý định của người dùng và tăng cường tính đa dạng của tập dữ liệu để làm phong phú thêm quá trình tinh chỉnh của mô hình nhúng. Hơn nữa, nó áp dụng các kỹ thuật trích xuất tóm tắt để mã hóa thông tin quan trọng trong các tài liệu kỹ thuật và cải thiện biểu diễn của chúng. Nhắc nhở mềm được sử dụng để tinh chỉnh mô hình BERT bộ mã hóa kép, và các tham số học riêng biệt cho ngữ cảnh truy vấn và văn bản được sử dụng để nắm bắt những khác biệt ngữ nghĩa tinh tế. Kết quả đánh giá trên hai tập dữ liệu công khai, RAG-EDA và Rust-Docs-QA, chứng minh rằng Technical-Embeddings vượt trội đáng kể so với các mô hình cơ sở về cả độ chính xác và độ thu hồi. Điều này chứng minh hiệu quả của việc tích hợp mở rộng truy vấn và tóm tắt ngữ cảnh để cải thiện khả năng truy cập và hiểu thông tin trong các lĩnh vực kỹ thuật. Nghiên cứu này thúc đẩy hệ thống Tạo dữ liệu tăng cường truy xuất (RAG) và trình bày một phương pháp mới để truy xuất tài liệu kỹ thuật hiệu quả và chính xác trong quy trình phát triển sản phẩm và kỹ thuật.

Takeaways, Limitations

Takeaways:
Trình bày một khuôn khổ để tối ưu hóa việc truy xuất tài liệu kỹ thuật bằng LLM.
Cải thiện hiệu suất tìm kiếm bằng cách kết hợp mở rộng truy vấn và tóm tắt ngữ cảnh.
Nắm bắt những khác biệt ngữ nghĩa tinh tế thông qua việc tinh chỉnh bằng các kỹ thuật nhắc nhở nhẹ nhàng.
ĐóNg góp vào sự phát triển của hệ thống RAG và đề xuất những cải tiến tiềm năng cho quy trình phát triển sản phẩm và kỹ thuật.
Hiệu suất được cải thiện đã được xác minh bằng thực nghiệm so với các mô hình hiện có trên tập dữ liệu RAG-EDA và Rust-Docs-QA.
Limitations:
Các tập dữ liệu được sử dụng có thể bị giới hạn (chỉ có hai tập dữ liệu được sử dụng: RAG-EDA và Rust-Docs-QA).
Hiệu suất tổng quát cho các loại tài liệu kỹ thuật khác hoặc các truy vấn phức tạp hơn cần được nghiên cứu thêm.
Có thể cần nghiên cứu thêm để xác định cài đặt thông số tối ưu cho lời nhắc mềm.
Cần có thêm các thí nghiệm và xác minh để ứng dụng vào môi trường công nghiệp thực tế.
👍