Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

WebShaper: Tổng hợp dữ liệu đại lý thông qua chính thức hóa tìm kiếm thông tin

Created by
  • Haebom

Tác giả

Zhengwei Tao, Jialong Wu, Wenbiao Yin, Junkai Zhang, Baixuan Li, Haiyang Shen, Kuan Li, Liwen Zhang, Xinyu Wang, Yong Jiang, Pengjun Xie, Fei Huang, Jingren Chu

Phác thảo

Bài báo này tập trung vào việc giải quyết các vấn đề phức tạp và mở bằng cách tận dụng khả năng tìm kiếm thông tin (IS) dựa trên web của các tác nhân dựa trên mô hình ngôn ngữ quy mô lớn (LLM). Các phương pháp tiếp cận dựa trên thông tin hiện có tạo ra các câu hỏi sau khi thu thập dữ liệu web, điều này có thể gây ra sự không khớp giữa cấu trúc thông tin và cấu trúc suy luận, và giữa các câu hỏi và câu trả lời. Để giải quyết vấn đề này, bài báo này đề xuất WebShaper, một khuôn khổ tổng hợp dữ liệu xây dựng các tác vụ IS một cách có hệ thống dựa trên lý thuyết tập hợp. WebShaper kiểm soát chính xác cấu trúc suy luận tập trung vào khái niệm chiếu kiến thức (KP) và tạo ra các tập dữ liệu thông qua quy trình mở rộng nhiều giai đoạn sau khi tạo tác vụ hạt giống. Bộ mở rộng dựa trên tác nhân sử dụng các công cụ tìm kiếm và xác minh dựa trên công thức để mở rộng các câu hỏi đã xây dựng hiện tại để làm cho chúng phức tạp hơn. Bằng cách đào tạo mô hình với tập dữ liệu tổng hợp, WebShaper đạt được hiệu suất tiên tiến trong số các tác nhân IS nguồn mở trên các điểm chuẩn GAIA và WebWalkerQA.

Takeaways, Limitations

Takeaways:
Chúng tôi giới thiệu WebShaper, một khuôn khổ tổng hợp dữ liệu mới giúp cải thiện hiệu suất của các tác nhân tìm kiếm thông tin trên web.
Giải quyết vấn đề không khớp giữa cấu trúc thông tin và cấu trúc suy luận thông qua hình thức dựa trên lý thuyết tập hợp.
Kiểm soát chính xác các cấu trúc suy luận bằng cách sử dụng khái niệm chiếu kiến thức (KP).
ĐạT được hiệu suất tiên tiến nhất trên các tiêu chuẩn GAIA và WebWalkerQA.
Limitations:
Những cải tiến về hiệu suất của WebShaper có thể bị giới hạn ở một số tiêu chuẩn cụ thể.
Cần phải xác nhận thêm hiệu suất tổng quát hóa trên các tập dữ liệu tổng hợp.
Cần có thêm nghiên cứu về khả năng ứng dụng của nó vào các nhiệm vụ tìm kiếm thông tin phức tạp và đa dạng trong thế giới thực.
👍