[공지사항]을 빙자한 안부와 근황 
Show more

Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

TextDestroyer: Phương pháp khuếch tán không cần đào tạo và chú thích để hủy văn bản bất thường khỏi hình ảnh

Created by
  • Haebom

Tác giả

Mạnh Thành Lý, Phí Siêu

Phác thảo

Trong bài báo này, chúng tôi đề xuất TextDestroyer, phương pháp đầu tiên để loại bỏ văn bản cảnh mà không cần huấn luyện và chú thích, sử dụng mô hình khuếch tán được huấn luyện trước. Các mô hình loại bỏ văn bản cảnh hiện có yêu cầu chú thích và huấn luyện lại phức tạp, đồng thời để lại thông tin văn bản mờ nhạt nhưng có thể nhận dạng được, điều này có thể làm ảnh hưởng đến bảo vệ quyền riêng tư và ẩn nội dung. TextDestroyer giải quyết những vấn đề này bằng cách sử dụng quy trình phân cấp ba giai đoạn để có được mặt nạ văn bản chính xác. Phương pháp này xáo trộn các vùng văn bản từ các mã bắt đầu tiềm ẩn bằng cách sử dụng phân phối Gauss trước khi tái tạo. Trong quá trình khử nhiễu khuếch tán, nền bị hỏng được khôi phục bằng cách tham chiếu các khóa và giá trị tự chú ý từ mã tiềm ẩn ban đầu. Ở mỗi bước đảo ngược, các mã tiềm ẩn được lưu trữ sẽ được thay thế trong quá trình tái tạo, đảm bảo khôi phục nền hoàn hảo. Ưu điểm của TextDestroyer bao gồm: (1) Nó loại bỏ chú thích dữ liệu tốn nhiều công sức và huấn luyện tốn nhiều tài nguyên. (2) Nó đạt được khả năng hủy văn bản triệt để hơn, do đó tránh được các dấu vết có thể nhận dạng được. (3) Nó cho thấy khả năng khái quát hóa tốt hơn, thể hiện hiệu suất tuyệt vời trên cả cảnh thực và hình ảnh được tạo ra.

Takeaways, Limitations

Takeaways:
Chúng tôi cải thiện hiệu quả bằng cách trình bày phương pháp xóa văn bản trong cảnh không yêu cầu đào tạo và chú thích.
Cải thiện quyền riêng tư và hiệu suất che giấu nội dung thông qua việc loại bỏ văn bản triệt để hơn so với các phương pháp hiện có.
Nó cho thấy hiệu suất khái quát tuyệt vời trên cả cảnh thực và hình ảnh được tạo ra.
Limitations:
Bài báo này không đề cập cụ thể đến Limitations. Cần thêm các thí nghiệm và phân tích để làm rõ Limitations. Ví dụ, lỗ hổng bảo mật đối với một số loại văn bản hoặc nền, chi phí tính toán, v.v. có thể là những lĩnh vực cần nghiên cứu thêm.
👍