Bài báo này đặt ra khả năng rằng các mô hình ngôn ngữ lớn, khi chúng phát triển thành các lập trình viên tự chủ, có thể tự động hóa các hoạt động tấn công mạng đầy rủi ro. Các cuộc kiểm toán mô hình hiện đại đang điều tra rủi ro an ninh mạng của các tác nhân như vậy, nhưng thường không xem xét đến quyền tự do mà kẻ thù được hưởng trong thế giới thực. Đặc biệt, các tác nhân an ninh mạng hung hăng có thể được cải thiện theo từng bước bởi các đối thủ tiềm năng thông qua các trình xác minh mạnh mẽ và các ưu đãi tài chính. Do đó, bài báo này xem xét nhu cầu xem xét các mô hình mối đe dọa mở rộng trong bối cảnh an ninh mạng, làm nổi bật các mức độ tự do khác nhau mà kẻ thù có thể có trong môi trường có trạng thái và không trạng thái với ngân sách tính toán cố định. Trong nghiên cứu của chúng tôi, chúng tôi chỉ ra rằng ngay cả với ngân sách tính toán tương đối nhỏ (8 giờ GPU H100), kẻ thù có thể cải thiện khả năng an ninh mạng của một tác nhân hơn 40% so với mức cơ sở trong InterCode CTF. Điều này nhấn mạnh sự cần thiết phải đánh giá rủi ro an ninh mạng của một tác nhân một cách năng động, cung cấp một bức tranh rủi ro thực tế hơn.