Bài báo này đề xuất ADClick, một thuật toán phân đoạn ảnh tương tác (IIS) dùng cho kiểm tra sản phẩm công nghiệp. ADClick cải thiện đáng kể hiệu suất của các mô hình phát hiện bất thường bằng cách tạo chú thích phát hiện bất thường ở cấp độ pixel chỉ với vài cú nhấp chuột của người dùng và mô tả văn bản ngắn gọn, mà không cần chú thích ở cấp độ pixel cho các mẫu lỗi (ví dụ: AP = 96,1% trên MVTec AD). Hơn nữa, chúng tôi giới thiệu ADClick-Seg, một khung đa phương thức giúp căn chỉnh các đặc điểm trực quan và lời nhắc văn bản bằng phương pháp dựa trên nguyên mẫu. Bằng cách kết hợp thông tin trước đó ở cấp độ pixel với các tín hiệu hướng dẫn ngôn ngữ, ADClick-Seg đạt được kết quả tiên tiến nhất trong nhiệm vụ phát hiện bất thường "đa lớp" đầy thách thức (AP = 80,0%, PRO = 97,5%, Pixel-AUROC = 99,1% trên MVTec AD).