Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

ĐIểm ngoại lệ dựa trên biểu đồ mở rộng (EHBOS)

Created by
  • Haebom

Tác giả

Tanvir Islam

Phác thảo

ĐIểm ngoại lệ dựa trên biểu đồ tần suất (HBOS) là một phương pháp phát hiện ngoại lệ được sử dụng rộng rãi do hiệu quả tính toán và tính đơn giản của nó. Tuy nhiên, vì nó giả định tính độc lập giữa các đặc điểm, khả năng phát hiện ngoại lệ trong các tập dữ liệu có tương tác đặc điểm đáng kể bị hạn chế. Trong bài báo này, chúng tôi đề xuất Điểm ngoại lệ dựa trên biểu đồ tần suất mở rộng (EHBOS), một cải tiến của HBOS kết hợp biểu đồ tần suất hai chiều để nắm bắt các mối quan hệ phụ thuộc giữa các cặp đặc điểm. Phần mở rộng này cho phép EHBOS xác định các bất thường theo ngữ cảnh và dựa trên sự phụ thuộc mà HBOS không phát hiện được. Sử dụng 17 tập dữ liệu chuẩn, chúng tôi đánh giá hiệu quả và tính mạnh mẽ của EHBOS trong nhiều tình huống phát hiện bất thường khác nhau. EHBOS vượt trội hơn HBOS trên một số tập dữ liệu mà tương tác đặc điểm rất quan trọng để xác định cấu trúc bất thường, đạt được những cải tiến đáng kể trong ROC AUC. Những kết quả này chứng minh rằng EHBOS có thể là một phần mở rộng có giá trị của HBOS để mô hình hóa các mối quan hệ phụ thuộc đặc điểm phức tạp. Đặc biệt trong các tập dữ liệu mà các bất thường về ngữ cảnh hoặc quan hệ đóng vai trò quan trọng, EHBOS cung cấp một công cụ phát hiện bất thường mới mạnh mẽ.

Takeaways, Limitations

Takeaways:
Chúng tôi đề xuất một thuật toán EHBOS khắc phục được những hạn chế của HBOS hiện tại bằng cách xem xét sự phụ thuộc lẫn nhau giữa các tính năng.
Kiểm chứng thực nghiệm tính hiệu quả và độ mạnh mẽ của EHBOS trong nhiều tình huống phát hiện bất thường khác nhau.
Chúng tôi đã quan sát thấy hiệu suất và ROC AUC được cải thiện so với HBOS trên các tập dữ liệu mà tương tác tính năng là quan trọng.
Cung cấp một công cụ mới hữu ích để phát hiện các giá trị ngoại lệ theo tình huống hoặc quan hệ.
Limitations:
Khả năng tăng khả năng mở rộng và chi phí tính toán cho các tập dữ liệu có nhiều chiều (do sử dụng biểu đồ hai chiều)
Cần nghiên cứu thêm để xác định kích thước thùng biểu đồ tối ưu.
Cần đánh giá hiệu suất tổng quát hóa cho nhiều loại mẫu ngoại lệ khác nhau
👍