Bài báo này đề xuất Chimera, một khuôn khổ đa tác nhân dựa trên mô hình ngôn ngữ quy mô lớn (LLM), để giải quyết tình trạng thiếu dữ liệu trong lĩnh vực phát hiện mối đe dọa nội gián (ITD). Chimera tự động mô phỏng các hoạt động nội gián lành tính và ác tính trong nhiều môi trường doanh nghiệp khác nhau và thu thập nhiều nhật ký khác nhau để tạo ra một tập dữ liệu mới, ChimeraLog. Chimera mô hình hóa mỗi nhân viên như một tác nhân với hành vi cụ thể theo vai trò và kết hợp các cuộc họp nhóm, tương tác hai chiều và các mô-đun lập lịch tự động để nắm bắt động lực thực tế của tổ chức. Tập dữ liệu ChimeraLog, bao gồm 15 loại tấn công nội gián, được tạo ra bằng cách mô phỏng các hoạt động trong ba lĩnh vực nhạy cảm: công ty công nghệ, công ty tài chính và tổ chức chăm sóc sức khỏe. Các nghiên cứu trên người và phân tích định lượng đã xác thực tính đa dạng, tính thực tế của ChimeraLog và sự hiện diện của các mô hình đe dọa có thể giải thích được. Đánh giá các phương pháp luận ITD hiện có cho thấy điểm F1 trung bình là 0,83 đối với ChimeraLog, thấp hơn đáng kể so với điểm 0,99 của tập dữ liệu CERT, chứng minh độ khó cao của ChimeraLog và tính hữu ích của nó trong việc thúc đẩy nghiên cứu ITD.