Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Chimera: Sử dụng LLM đa tác nhân để mô phỏng mối đe dọa nội gián tự động

Created by
  • Haebom

Tác giả

Jiongchi Yu, Xiaofei Xie, Qiang Hu, Yuhan Ma, Ziming Zhao

Phác thảo

Bài báo này đề xuất Chimera, một khuôn khổ đa tác nhân dựa trên mô hình ngôn ngữ quy mô lớn (LLM), để giải quyết tình trạng thiếu dữ liệu trong lĩnh vực phát hiện mối đe dọa nội gián (ITD). Chimera tự động mô phỏng các hoạt động nội gián lành tính và ác tính trong nhiều môi trường doanh nghiệp khác nhau và thu thập nhiều nhật ký khác nhau để tạo ra một tập dữ liệu mới, ChimeraLog. Chimera mô hình hóa mỗi nhân viên như một tác nhân với hành vi cụ thể theo vai trò và kết hợp các cuộc họp nhóm, tương tác hai chiều và các mô-đun lập lịch tự động để nắm bắt động lực thực tế của tổ chức. Tập dữ liệu ChimeraLog, bao gồm 15 loại tấn công nội gián, được tạo ra bằng cách mô phỏng các hoạt động trong ba lĩnh vực nhạy cảm: công ty công nghệ, công ty tài chính và tổ chức chăm sóc sức khỏe. Các nghiên cứu trên người và phân tích định lượng đã xác thực tính đa dạng, tính thực tế của ChimeraLog và sự hiện diện của các mô hình đe dọa có thể giải thích được. Đánh giá các phương pháp luận ITD hiện có cho thấy điểm F1 trung bình là 0,83 đối với ChimeraLog, thấp hơn đáng kể so với điểm 0,99 của tập dữ liệu CERT, chứng minh độ khó cao của ChimeraLog và tính hữu ích của nó trong việc thúc đẩy nghiên cứu ITD.

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày khả năng tạo ra bộ dữ liệu về mối đe dọa nội gián thực tế thông qua mô phỏng đa tác nhân dựa trên LLM.
Bộ dữ liệu ChimeraLog có mức độ khó cao hơn các bộ dữ liệu hiện có và góp phần thúc đẩy nghiên cứu ITD.
Triển khai các kịch bản thực tế phản ánh nhiều môi trường doanh nghiệp khác nhau và các loại tấn công nội gián.
Giúp cải thiện khả năng diễn giải của các mô hình ITD bằng cách đưa vào các mô hình đe dọa có thể giải thích được.
Limitations:
Thiếu mô tả chi tiết về quá trình tạo và các thông số của tập dữ liệu ChimeraLog.
Cần phải xác minh thêm để đảm bảo phù hợp hoàn toàn với môi trường kinh doanh thực tế.
Khả năng dữ liệu có thể bị thiên lệch về một môi trường doanh nghiệp cụ thể.
Không thể đề cập đến tất cả các loại tấn công nội gián.
👍