Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

AutoSchemaKG: Xây dựng đồ thị tri thức tự động thông qua quy nạp lược đồ động từ tập đoàn web

Created by
  • Haebom

Tác giả

Jiaxin Bai, Wei Fan, Qi Hu, Qing Zong, Chunyang Li, Hong Ting Tsang, Hongyu Luo, Yauwai Yim, Haoyu Huang, Xiao Chu, Feng Qin, Tianshi Zheng, Xi Peng, Xin Yao, Huiwen Yang, Leijie Wu, Yi Ji, Gong Zhang, Renhai Chen, Yangqiu Song

Phác thảo

AutoSchemaKG là một khuôn khổ cho việc tạo đồ thị tri thức hoàn toàn tự động mà không cần lược đồ được xác định trước. Nó tận dụng các mô hình ngôn ngữ quy mô lớn để trích xuất các bộ ba tri thức từ văn bản và đồng thời tạo ra một lược đồ toàn diện, mô hình hóa cả thực thể và sự kiện, đồng thời sắp xếp các trường hợp thành các phạm trù ngữ nghĩa thông qua quá trình khái niệm hóa. Bằng cách xử lý hơn 50 triệu tài liệu, chúng tôi đã xây dựng một đồ thị tri thức, ATLAS (Liên kết Bộ ba Tự động và Quy nạp Sơ đồ), với hơn 900 triệu nút và 5,9 tỷ cạnh. Phương pháp này vượt trội hơn các chuẩn mực tiên tiến trong các tác vụ trả lời câu hỏi nhiều bước và nâng cao tính thực tế của LLM. Cụ thể, quy nạp sơ đồ đạt được sự liên kết ngữ nghĩa 92% với các lược đồ do con người tạo ra mà không cần can thiệp thủ công, chứng minh rằng một đồ thị tri thức một tỷ đơn vị với các lược đồ được quy nạp động có thể bổ sung hiệu quả cho tri thức tham số của các mô hình ngôn ngữ quy mô lớn.

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày một khuôn khổ mới để xây dựng biểu đồ kiến thức hoàn toàn tự động mà không cần lược đồ được xác định trước.
Trích xuất ba kiến thức đồng thời và suy ra lược đồ bằng cách sử dụng các mô hình ngôn ngữ quy mô lớn.
Xây dựng biểu đồ kiến thức quy mô tỷ đơn vị, ATLAS, để cải thiện hiệu suất trả lời câu hỏi nhiều bước và tăng cường tính trung thực của LLM.
Các lược đồ được suy ra tự động đạt được sự liên kết ngữ nghĩa cao (92%) với các lược đồ do con người tạo ra.
Chúng tôi trình bày tiềm năng của đồ thị kiến thức với các lược đồ được suy ra một cách động để bổ sung hiệu quả cho kiến thức tham số của các mô hình ngôn ngữ quy mô lớn.
Limitations:
Limitations không được đề cập rõ ràng trong bài báo. Có thể cần nghiên cứu thêm để cải thiện độ chính xác của việc suy luận lược đồ và xác minh tính ứng dụng của nó cho nhiều loại dữ liệu khác nhau. Hơn nữa, có thể cần đánh giá thêm về tính đầy đủ và độ tin cậy của biểu đồ tri thức được tạo ra.
👍