Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

IAD-R1: Tăng cường lý luận nhất quán trong phát hiện bất thường công nghiệp

Created by
  • Haebom

Tác giả

Yanhui Li, Yunkang Cao, Chengliang Liu, Yuan Xiong, Xinghui Dong, Chao Huang

Phác thảo

Bài báo này đề xuất IAD-R1, một khuôn khổ đào tạo sau mới tận dụng Mô hình Ngôn ngữ Thị giác (VLM) để giải quyết vấn đề phát hiện bất thường trong môi trường công nghiệp. Để giải quyết tình trạng thiếu dữ liệu lỗi, chúng tôi sử dụng chiến lược đào tạo hai giai đoạn. Giai đoạn đầu tiên, Điều chỉnh tinh chỉnh có giám sát kích hoạt nhận thức (PA-SFT), sử dụng bộ dữ liệu Chuỗi suy nghĩ chất lượng cao Expert-AD để tăng cường phát hiện bất thường và thiết lập mối tương quan suy luận-câu trả lời. Giai đoạn thứ hai, Tối ưu hóa chính sách tương đối nhóm kiểm soát có cấu trúc (SC-GRPO), tiếp tục tăng cường phát hiện bất thường thông qua hàm thưởng. Kết quả thử nghiệm chứng minh rằng IAD-R1 cải thiện hiệu suất trên bảy VLM, đặc biệt là trên bộ dữ liệu DAGM, đạt được mức cải thiện độ chính xác trung bình là 43,3% so với mô hình cơ sở. Hơn nữa, mô hình tham số 0,5B được đào tạo bằng IAD-R1 vượt trội hơn các mô hình thương mại như GPT-4.1 và Claude-Sonnet-4 trong cài đặt không có cú đánh nào. Mã, tập dữ liệu và trọng số mô hình đều được công khai.

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày một khuôn khổ đào tạo sau mới, IAD-R1, giúp cải thiện đáng kể hiệu suất phát hiện dị thường công nghiệp dựa trên VLM.
Tính linh hoạt áp dụng cho nhiều kiến trúc VLM và kích thước tham số khác nhau
ĐạT được hiệu suất vượt trội so với các mẫu thương mại trong cài đặt không có cú đánh nào
Chứng minh tính hiệu quả của Expert-AD, một bộ dữ liệu chuỗi suy nghĩ chất lượng cao
Tăng khả năng tái tạo và mở rộng nghiên cứu bằng cách công khai mã, tập dữ liệu và trọng số mô hình.
Limitations:
Có khả năng hiệu suất cải thiện của IAD-R1 có thể thiên về một tập dữ liệu cụ thể (DAGM).
Cần xác minh hiệu suất tổng quát cho các ngành công nghiệp khác hoặc các loại bất thường
Có thể thiếu mô tả chi tiết về quy trình tạo và chất lượng của tập dữ liệu Expert-AD
Cần có thêm lời giải thích về thiết kế chức năng thưởng của SC-GRPO.
👍