Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

SGDFuse: Khuếch tán được hướng dẫn bởi SAM để hợp nhất hình ảnh hồng ngoại và hình ảnh khả kiến ​​có độ trung thực cao

Created by
  • Haebom

Tác giả

Xiaoyang Zhang, Zhen Hua, Yakun Ju, Wei Zhou, Jun Liu, Alex C. Kot

Phác thảo

Bài báo này đề xuất SGDFuse, một mô hình khuếch tán có điều kiện sử dụng Mô hình Bất kỳ Phân đoạn nào (SAM), để giải quyết những thiếu sót của các phương pháp hiện có trong hợp nhất ảnh hồng ngoại-khả kiến ​​(IVIF), bao gồm thiếu hiểu biết ngữ nghĩa sâu sắc, tạo ra hiện tượng giả và mất chi tiết. SGDFuse tối ưu hóa quá trình hợp nhất thông qua mô hình khuếch tán có điều kiện, tận dụng các mặt nạ ngữ nghĩa chất lượng cao do SAM tạo ra làm thông tin trước rõ ràng. Quá trình hai bước bao gồm đầu tiên thực hiện hợp nhất sơ bộ các đặc điểm đa phương thức, sau đó khử nhiễu mô hình khuếch tán từ thô sang tinh, dựa trên các mặt nạ ngữ nghĩa từ SAM và ảnh hợp nhất sơ bộ. Điều này đảm bảo tính định hướng ngữ nghĩa và độ trung thực cao của kết quả cuối cùng. Kết quả thử nghiệm chứng minh rằng SGDFuse đạt được hiệu suất tiên tiến về mặt đánh giá chủ quan và khách quan, cũng như khả năng áp dụng cho các tác vụ hạ nguồn. Mã nguồn có sẵn trên GitHub.

Takeaways, Limitations

Takeaways:
Chúng tôi chứng minh rằng SAM có thể được sử dụng để thu được kết quả hợp nhất hình ảnh ánh sáng hồng ngoại và ánh sáng khả kiến ​​có chất lượng cao và giàu ngữ nghĩa.
Giải quyết hiệu quả các vấn đề về tạo ra hiện vật và mất thông tin chi tiết trong các phương pháp hiện có.
Khả năng ứng dụng tuyệt vời vào các nhiệm vụ tiếp theo, tiềm năng ứng dụng thực tế cao.
ĐạT được hiệu suất tiên tiến.
ĐảM bảo khả năng tái tạo và mở rộng thông qua mã nguồn mở.
Limitations:
Có thể phụ thuộc vào hiệu suất của SAM. Sự suy giảm hiệu suất của SAM có thể ảnh hưởng đến hiệu suất của SGDFuse.
Có thể tốn kém về mặt tính toán. Vì dựa trên mô hình khuếch tán nên thời gian xử lý có thể lâu.
SAM có thể hoạt động kém trên một số loại hình ảnh nhất định, do đó có khả năng hiệu suất hợp nhất trên các hình ảnh này sẽ kém.
👍