Trong bài báo này, chúng tôi đề xuất TextDestroyer, phương pháp đầu tiên để loại bỏ văn bản cảnh mà không cần huấn luyện và chú thích, sử dụng mô hình khuếch tán được huấn luyện trước. Các mô hình loại bỏ văn bản cảnh hiện có yêu cầu chú thích và huấn luyện lại phức tạp, đồng thời để lại thông tin văn bản mờ nhạt nhưng có thể nhận dạng được, điều này có thể làm ảnh hưởng đến bảo vệ quyền riêng tư và ẩn nội dung. TextDestroyer giải quyết những vấn đề này bằng cách sử dụng quy trình phân cấp ba giai đoạn để có được mặt nạ văn bản chính xác. Phương pháp này xáo trộn các vùng văn bản từ các mã bắt đầu tiềm ẩn bằng cách sử dụng phân phối Gauss trước khi tái tạo. Trong quá trình khử nhiễu khuếch tán, nền bị hỏng được khôi phục bằng cách tham chiếu các khóa và giá trị tự chú ý từ mã tiềm ẩn ban đầu. Ở mỗi bước đảo ngược, các mã tiềm ẩn được lưu trữ sẽ được thay thế trong quá trình tái tạo, đảm bảo khôi phục nền hoàn hảo. Ưu điểm của TextDestroyer bao gồm: (1) Nó loại bỏ chú thích dữ liệu tốn nhiều công sức và huấn luyện tốn nhiều tài nguyên. (2) Nó đạt được khả năng hủy văn bản triệt để hơn, do đó tránh được các dấu vết có thể nhận dạng được. (3) Nó cho thấy khả năng khái quát hóa tốt hơn, thể hiện hiệu suất tuyệt vời trên cả cảnh thực và hình ảnh được tạo ra.