Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới. Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận. Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.
TMUAD: Nâng cao khả năng logic trong các mô hình phát hiện dị thường thống nhất với ngân hàng bộ nhớ văn bản
Created by
Haebom
Tác giả
Jiawei Liu, Jiahe Hou, Wei Wang, Jinsong Du, Yang Cong, Huijie Fan
Phác thảo
Bài báo này đề xuất một khuôn khổ ba bộ nhớ cho phát hiện bất thường về cấu trúc và logic thống nhất (TMUAD), không giống như các phương pháp tích hợp hiện có, TMUAD giới thiệu một ngân hàng bộ nhớ văn bản để tăng cường phát hiện bất thường về logic. TMUAD sử dụng một trình trích xuất văn bản nhận biết logic được đề xuất để xây dựng một ngân hàng bộ nhớ văn bản cấp lớp để nắm bắt các mô tả logic phong phú về các đối tượng trong hình ảnh. Sau đó, nó trích xuất các đặc điểm từ các đối tượng đã phân đoạn để xây dựng một ngân hàng bộ nhớ hình ảnh cấp đối tượng và trích xuất các đặc điểm hình ảnh cấp vá để xây dựng một ngân hàng bộ nhớ cấp vá. Sử dụng ba ngân hàng bộ nhớ bổ sung này, nó truy xuất và so sánh các hình ảnh bình thường giống nhất với hình ảnh truy vấn, tính toán điểm ngoại lệ đa cấp và hợp nhất chúng thành một điểm ngoại lệ cuối cùng. Phương pháp tiếp cận thống nhất này đạt được hiệu suất tiên tiến trên bảy tập dữ liệu công khai từ các lĩnh vực công nghiệp và y tế bằng cách tích hợp phát hiện bất thường về cấu trúc và logic. Mô hình và mã có sẵn tại https://github.com/SIA-IDE/TMUAD .