Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

GuARD: Phát hiện bất thường hiệu quả thông qua mô hình ngôn ngữ giàu văn bản và dựa trên đồ thị

Created by
  • Haebom

Tác giả

Yunhe Pang, Bo Chen, Fanjin Zhang, Yanghui Rao, Evgeny Kharlamov, Jie Tang

Phác thảo

Bài báo này đề xuất GuARD, một mô hình mới để phát hiện bất thường trong đồ thị giàu văn bản. Các phương pháp phát hiện bất thường dựa trên mô hình ngôn ngữ quy mô lớn (LLM) hiện có gặp phải những hạn chế, chẳng hạn như không thể sử dụng hiệu quả thông tin văn bản hoặc không xem xét các đặc điểm cấu trúc của đồ thị. GuARD giải quyết những thách thức này bằng cách kết hợp các đặc điểm cấu trúc của các phương pháp dựa trên đồ thị với các đặc tính ngữ nghĩa chi tiết được trích xuất từ các mô hình ngôn ngữ quy mô nhỏ. Nó sử dụng một khuôn khổ điều chỉnh chỉ thị đa phương thức, đa bước tiên tiến, được tối ưu hóa để tích hợp cả phương thức văn bản và cấu trúc. Kết quả thử nghiệm trên bốn tập dữ liệu cho thấy hiệu suất, tốc độ huấn luyện và tốc độ suy luận vượt trội so với các phương pháp hiện có.

Takeaways, Limitations

Takeaways:
Cải thiện hiệu suất phát hiện dị thường trong đồ thị nhiều văn bản: GuARD chứng minh hiệu suất phát hiện dị thường vượt trội so với các phương pháp hiện có.
Tăng tốc quá trình đào tạo và suy luận: Tăng tốc lên đến 5 lần so với các phương pháp dựa trên LLM hiện có.
Kết hợp hiệu quả giữa cấu trúc đồ thị và thông tin văn bản: Sử dụng hiệu quả các đặc điểm cấu trúc của đồ thị và các đặc tính ngữ nghĩa của văn bản.
_____T21783____-:
Cần phải xác minh thêm hiệu suất tổng quát của mô hình đề xuất.
Cần đánh giá khả năng áp dụng cho nhiều loại dữ liệu đồ thị khác nhau.
Cần phải phân tích những thay đổi về hiệu suất tùy thuộc vào việc lựa chọn mô hình ngôn ngữ nhỏ được sử dụng.
👍