Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Hướng tới việc dán nhãn điểm ảnh hiệu quả để phát hiện và định vị bất thường trong công nghiệp

Created by
  • Haebom

Tác giả

Jingqi Wu, Hanxi Li, Lin Yuanbo Wu, Hao Chen, Deyin Liu, Peng Wang

Phác thảo

Bài báo này đề xuất ADClick, một thuật toán phân đoạn ảnh tương tác (IIS) dùng cho kiểm tra sản phẩm công nghiệp. ADClick cải thiện đáng kể hiệu suất của các mô hình phát hiện bất thường bằng cách tạo chú thích phát hiện bất thường ở cấp độ pixel chỉ với vài cú nhấp chuột của người dùng và mô tả văn bản ngắn gọn, mà không cần chú thích ở cấp độ pixel cho các mẫu lỗi (ví dụ: AP = 96,1% trên MVTec AD). Hơn nữa, chúng tôi giới thiệu ADClick-Seg, một khung đa phương thức giúp căn chỉnh các đặc điểm trực quan và lời nhắc văn bản bằng phương pháp dựa trên nguyên mẫu. Bằng cách kết hợp thông tin trước đó ở cấp độ pixel với các tín hiệu hướng dẫn ngôn ngữ, ADClick-Seg đạt được kết quả tiên tiến nhất trong nhiệm vụ phát hiện bất thường "đa lớp" đầy thách thức (AP = 80,0%, PRO = 97,5%, Pixel-AUROC = 99,1% trên MVTec AD).

Takeaways, Limitations

Takeaways:
Tạo chú thích phát hiện dị thường hiệu quả và chính xác mà không cần chú thích ở cấp độ pixel.
Có thể phát hiện chính xác hiện tượng bất thường chỉ bằng cú nhấp chuột của người dùng và mô tả bằng văn bản.
Tận dụng hiệu quả các tính năng trực quan và lời nhắc văn bản thông qua khuôn khổ đa phương thức.
ĐạT được hiệu suất tiên tiến nhất trên tập dữ liệu MVTec AD
Limitations:
Cần có thêm các thí nghiệm để đánh giá hiệu suất tổng quát của phương pháp đề xuất.
Cần đánh giá khả năng áp dụng cho nhiều môi trường công nghiệp và loại sản phẩm khác nhau
Cần phân tích những thay đổi về hiệu suất theo số lần nhấp chuột của người dùng hoặc chất lượng mô tả văn bản
👍