Trong bài báo này, chúng tôi trình bày $\textbf{$\texttt{DroidCollection}$}$, bộ dữ liệu mở rộng lớn nhất dùng để huấn luyện và đánh giá các bộ phát hiện mã do máy tạo ra. $\texttt{DroidCollection}$ chứa hơn một triệu mẫu mã, bảy ngôn ngữ lập trình, 43 đầu ra mô hình mã hóa và ít nhất ba miền mã hóa thực tế. Ngoài các mẫu hoàn toàn do AI tạo ra, nó còn bao gồm mã do con người đồng tác giả và các mẫu đối kháng được tạo ra một cách rõ ràng để tránh bị phát hiện. Sau đó, chúng tôi phát triển $\textbf{$\texttt{DroidDetect}$}$, một bộ các bộ phát hiện dành riêng cho bộ mã hóa được huấn luyện trên các mục tiêu đa tác vụ bằng $\texttt{DroidCollection}$. Kết quả thử nghiệm chứng minh rằng hiệu suất của các bộ phát hiện hiện có không thể khái quát hóa vượt ra ngoài tập dữ liệu huấn luyện hẹp cho các miền mã hóa và ngôn ngữ lập trình đa dạng. Hơn nữa, trong khi hầu hết các bộ dò dễ bị ảnh hưởng bởi việc nhân bản hóa phân phối đầu ra bằng các phương pháp căn chỉnh và nhắc nhở hời hợt, chúng tôi chứng minh rằng việc huấn luyện với một lượng nhỏ dữ liệu đối nghịch có thể dễ dàng giải quyết vấn đề này. Cuối cùng, chúng tôi chứng minh tính hiệu quả của việc học số liệu và lấy mẫu lại dựa trên sự không chắc chắn như một phương tiện cải thiện việc huấn luyện bộ dò trong các phân phối có khả năng gây nhiễu.