Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Khảo sát về Nhận dạng Nguyên nhân Sự kiện: Phân loại, Thách thức, Đánh giá và Triển vọng

Created by
  • Haebom

Tác giả

Qing Cheng, Zefan Zeng, Xingchen Hu, Yuehang Si, Zhong Liu

Phác thảo

Bài báo này trình bày một khảo sát toàn diện về nhận dạng nhân quả sự kiện (ECI), một nhiệm vụ thiết yếu trong xử lý ngôn ngữ tự nhiên (NLP), tự động phát hiện mối quan hệ nhân quả giữa các sự kiện trong văn bản. Chúng tôi định nghĩa các khái niệm chính, chính thức hóa bài toán ECI và trình bày một giao thức đánh giá chuẩn. Chúng tôi phát triển một khung phân loại, phân loại các mô hình ECI thành hai nhiệm vụ chính: nhận dạng nhân quả sự kiện ở cấp độ câu (SECI) và nhận dạng nhân quả sự kiện ở cấp độ tài liệu (DECI). Đối với SECI, chúng tôi xem xét các mô hình sử dụng khớp mẫu đặc trưng, bộ phân loại học máy, mã hóa ngữ nghĩa sâu, tinh chỉnh dựa trên lời nhắc, và các chiến lược tiền huấn luyện tri thức nhân quả và tăng cường dữ liệu. Đối với DECI, chúng tôi tập trung vào các phương pháp tận dụng mã hóa ngữ nghĩa sâu, suy luận đồ thị sự kiện và tinh chỉnh dựa trên lời nhắc. Chúng tôi đặc biệt chú ý đến những tiến bộ gần đây trong ECI đa ngôn ngữ và xuyên ngôn ngữ, cũng như ECI zero-shot sử dụng các mô hình ngôn ngữ quy mô lớn (LLM). Chúng tôi phân tích các điểm mạnh, hạn chế và thách thức liên quan đến từng phương pháp, đồng thời thực hiện các đánh giá định lượng chuyên sâu trên bốn tập dữ liệu chuẩn để đánh giá hiệu suất của các mô hình ECI khác nhau một cách nghiêm ngặt. Cuối cùng, chúng tôi thảo luận về các hướng nghiên cứu trong tương lai và nêu bật các cơ hội để thúc đẩy lĩnh vực này hơn nữa.

Takeaways, Limitations

Takeaways:
Mô hình ECI được phân loại một cách có hệ thống thành SECI và DECI để có thể hiểu toàn diện về tình trạng nghiên cứu.
Cung cấp đánh giá toàn diện về nhiều mô hình ECI khác nhau (so khớp dựa trên mẫu tính năng, học máy, mã hóa ngữ nghĩa sâu, tinh chỉnh dựa trên lời nhắc, đào tạo trước kiến thức nhân quả, v.v.).
Phản ánh các xu hướng nghiên cứu mới nhất bao gồm ECI đa ngôn ngữ và liên ngôn ngữ, ECI không cần tiêm.
Chúng tôi trình bày các đánh giá thử nghiệm nghiêm ngặt bằng cách sử dụng bốn tập dữ liệu chuẩn.
ĐóNg góp vào sự phát triển của lĩnh vực ECI bằng cách đề xuất các hướng nghiên cứu trong tương lai.
Limitations:
Các loại mô hình ECI được đề cập trong bài viết này có thể không đầy đủ.
Do các mô hình ECI và tập dữ liệu mới liên tục xuất hiện nên có thể có những hạn chế trong việc phản ánh các xu hướng nghiên cứu mới nhất sau khi một bài báo được xuất bản.
Khó khăn trong việc áp dụng tiêu chí đánh giá thống nhất cho tất cả các mô hình ECI.
Hiệu suất khái quát hóa có thể kém do sử dụng bộ dữ liệu thiên về một ngôn ngữ hoặc miền cụ thể.
👍