Bài báo này đề xuất một khuôn khổ RAG (Retrieval-Augmented Generation) tiên tiến sử dụng dữ liệu cụ thể của doanh nghiệp như hồ sơ nhân sự, báo cáo có cấu trúc và tài liệu dạng bảng, vốn rất cần thiết cho việc ra quyết định của công ty. Để giải quyết những hạn chế của các khuôn khổ RAG hiện có như tiền huấn luyện tĩnh, cửa sổ ngữ cảnh ngắn và xử lý định dạng dữ liệu không đồng nhất, chúng tôi áp dụng chiến lược tìm kiếm kết hợp giữa nhúng dày đặc (all-mpnet-base-v2) và BM25, lọc dựa trên siêu dữ liệu sử dụng SpaCy NER và xếp hạng lại bộ mã hóa chéo. Ngoài ra, chúng tôi cải thiện hiệu suất bằng cách phân đoạn các đơn vị ngữ nghĩa, duy trì cấu trúc dữ liệu dạng bảng, lập chỉ mục lượng tử, phản hồi của người dùng và các chức năng bộ nhớ hội thoại. Kết quả của các thử nghiệm trên các tập dữ liệu của công ty cho thấy Precision@5 được cải thiện 15%, Recall@5 được cải thiện 13% và xếp hạng ngược trung bình được cải thiện 16%, đồng thời cho thấy những cải thiện về mặt định tính về độ chính xác, tính đầy đủ và tính liên quan. Trong tương lai, chúng tôi có kế hoạch mở rộng dữ liệu đa phương thức và tích hợp tìm kiếm dựa trên tác nhân, đồng thời mã nguồn sẽ được công khai.