Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới. Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận. Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.
QuRe: Truy xuất liên quan đến truy vấn thông qua lấy mẫu tiêu cực cứng trong truy xuất hình ảnh tổng hợp
Created by
Haebom
Tác giả
Jaehyun Kwak, Ramahdani Muhammad Izaaz Inhar, Se-Young Yun, Sung-Ju Lee
Phác thảo
Bài báo này đề cập đến vấn đề truy xuất hình ảnh tổng hợp (CIR), trong đó truy xuất hình ảnh có liên quan dựa trên hình ảnh tham chiếu và văn bản mô tả sửa đổi mong muốn. Các phương pháp CIR hiện có có hạn chế là chúng chỉ tập trung vào việc truy xuất hình ảnh mục tiêu và bỏ qua sự liên quan của các hình ảnh khác, điều này là do hầu hết các phương pháp sử dụng học tương phản coi hình ảnh mục tiêu là dương tính và tất cả các hình ảnh khác trong lô là âm tính, có thể bao gồm cả âm tính giả. Trong bài báo này, chúng tôi đề xuất QuRe (Truy xuất liên quan đến truy vấn thông qua lấy mẫu âm tính cứng), tối ưu hóa hàm mục tiêu của mô hình phần thưởng để giảm âm tính giả. Ngoài ra, chúng tôi giới thiệu một chiến lược lấy mẫu âm tính cứng chọn các hình ảnh nằm giữa hai lần giảm mạnh về điểm liên quan sau hình ảnh mục tiêu, lọc hiệu quả các âm tính giả. Để đánh giá sự phù hợp với sở thích của con người, chúng tôi tạo một tập dữ liệu mới, Human-Preference FashionIQ (HP-FashionIQ), nắm bắt rõ ràng sở thích của người dùng ngoài mục tiêu truy xuất. Kết quả thử nghiệm cho thấy QuRe đạt hiệu suất vượt trội trên các tập dữ liệu FashionIQ và CIRR, đồng thời phù hợp nhất với sở thích của con người trên tập dữ liệu HP-FashionIQ. Mã nguồn có thể được tìm thấy tại https://github.com/jackwaky/QuRe .