Bài báo này nhấn mạnh tầm quan trọng của việc đào tạo các mô hình học máy để hiểu rõ các yếu tố xác định từng lớp. Các nghiên cứu trước đây tập trung vào việc xác định các tương quan giả trong các tập dữ liệu bằng cách chỉ dựa vào dữ liệu hoặc phân tích lỗi, nhưng đã không phát hiện ra các tương quan giả được các mô hình học được mà không được tiết lộ bởi các phản ví dụ trong tập xác thực hoặc tập huấn luyện. Để khắc phục những hạn chế này, bài báo này đề xuất WASP (Phương pháp không gian trọng số để phát hiện tính giả), một phương pháp mới phân tích các trọng số của mô hình, cơ chế ra quyết định, thay vì phân tích các dự đoán của mô hình. WASP phân tích cách các trọng số của mô hình cơ sở dịch chuyển theo hướng nắm bắt các tương quan (giả) khác nhau trong quá trình tinh chỉnh trên một tập dữ liệu cụ thể. Không giống như các nghiên cứu trước đây, WASP (i) phơi bày các tương quan giả trong các tập dữ liệu không được tiết lộ bởi các phản ví dụ huấn luyện hoặc xác thực, (ii) hoạt động trên nhiều phương thức khác nhau, chẳng hạn như hình ảnh và văn bản, và (iii) chứng minh khả năng phát hiện các tương quan giả trước đây chưa biết được học bởi bộ phân loại ImageNet-1k.