Bài báo này trình bày Compliance Brain Assistant (CBA), một trợ lý AI đàm thoại được thiết kế để cải thiện hiệu quả các nhiệm vụ tuân thủ hàng ngày của nhân viên trong môi trường doanh nghiệp. CBA sử dụng bộ định tuyến truy vấn người dùng cung cấp hai chế độ để cân bằng chất lượng phản hồi và độ trễ. Thứ nhất, chế độ FastTrack, xử lý các yêu cầu đơn giản, truy xuất thông tin liên quan từ kho lưu trữ kiến thức. Thứ hai, chế độ FullAgentic, xử lý các yêu cầu phức tạp, chủ động tìm kiếm ngữ cảnh trong nhiều tài liệu tuân thủ khác nhau và thực hiện các thao tác phức tạp và gọi công cụ để xử lý các yêu cầu bằng cách tận dụng các API/mô hình khác nhau. Kết quả đánh giá thử nghiệm cho thấy CBA cải thiện đáng kể hiệu suất của LLM hiện tại về tỷ lệ khớp từ khóa trung bình (83,7% so với 41,7%) và tỷ lệ vượt qua đánh giá LLM (82,0% so với 20,0%) cho nhiều truy vấn liên quan đến quyền riêng tư/tuân thủ trong thế giới thực. Ngoài ra, thiết kế dựa trên định tuyến được so sánh với chế độ chỉ theo dõi nhanh và chế độ tác nhân đầy đủ , và kết quả cho thấy tỷ lệ khớp lệnh trung bình và tỷ lệ vượt qua cao hơn trong khi vẫn duy trì thời gian thực hiện gần như giống nhau, xác minh giả thuyết rằng cơ chế định tuyến cung cấp sự cân bằng tốt giữa hai chế độ.