[공지사항]을 빙자한 안부와 근황 
Show more

Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

THOR: Thuật toán biến đổi cho việc truy xuất theo yêu cầu

Created by
  • Haebom

Tác giả

Isaac Shi, Zeyuan Li, Fan Liu, Wenli Wang, Lewei He, Yang Yang, Tianyu Shi

Phác thảo

Mô-đun Transformer Heuristics for On-Demand Retrieval (THOR) do eSapiens phát triển là một công cụ an toàn và có khả năng mở rộng, giúp chuyển đổi các câu hỏi ngôn ngữ tự nhiên thành các truy vấn phân tích SQL chỉ đọc đã được xác thực. Dựa trên kiến trúc dàn dựng/thực thi tách biệt, tác nhân giám sát định tuyến các truy vấn, khám phá lược đồ tự động chèn siêu dữ liệu bảng và cột, và tác nhân tạo SQL tạo các truy vấn SELECT câu lệnh đơn được bảo vệ bởi các biện pháp bảo vệ chỉ đọc. Vòng lặp tự sửa lỗi và đánh giá tích hợp phát hiện kết quả trống, lỗi thực thi hoặc đầu ra chất lượng kém và thử tái tạo dựa trên LLM tối đa năm lần. Cuối cùng, tác nhân diễn giải kết quả tạo ra các thông tin chi tiết ngắn gọn, dễ đọc và chuyển các hàng thô đến công cụ Thông tin chi tiết và Trí tuệ để trực quan hóa hoặc dự đoán. Các bài kiểm tra khói cho các tình huống tài chính, bán hàng và vận hành chứng minh các truy vấn ad hoc đáng tin cậy và báo cáo định kỳ tự động. Bằng cách kết hợp nhận thức lược đồ, thực thi chịu lỗi và các biện pháp bảo vệ tuân thủ, mô-đun THOR cho phép người dùng không chuyên môn truy cập dữ liệu trực tiếp một cách an toàn mà không cần SQL.

Takeaways, Limitations

Takeaways:
Biên dịch các câu hỏi bằng ngôn ngữ tự nhiên thành các truy vấn SQL để cải thiện khả năng truy cập dữ liệu cho người dùng không chuyên về kỹ thuật.
Tăng cường bảo mật dữ liệu bằng tính năng bảo vệ chỉ đọc.
Tăng độ tin cậy của việc thực hiện truy vấn thông qua các vòng lặp tự sửa lỗi và đánh giá.
ÁP dụng cho nhiều tình huống kinh doanh khác nhau (tài chính, bán hàng, vận hành).
Cung cấp khả năng báo cáo định kỳ tự động.
Limitations:
Do những hạn chế trong việc tái tạo dựa trên LLM, độ chính xác của một số câu hỏi phức tạp có thể bị giảm.
Hiệu suất của hệ thống có thể phụ thuộc vào độ chính xác của việc nhận dạng lược đồ.
Cần phải xác thực thêm về hiệu suất và khả năng mở rộng trên các tập dữ liệu lớn.
Thiếu thông tin về các loại cơ sở dữ liệu và lược đồ hiện đang được hỗ trợ.
Cần phải xem xét lại tính ổn định và bảo trì lâu dài trong môi trường vận hành thực tế.
👍