[공지사항]을 빙자한 안부와 근황 
Show more

Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Dự đoán vị trí Học tự giám sát cho hình ảnh vệ tinh đa phương thức Phân đoạn ngữ nghĩa

Created by
  • Haebom

Tác giả

John Waithaka, Moise Busogi

Phác thảo

Trong bài báo này, chúng tôi đề xuất một phương pháp học tự giám sát mới để phân đoạn ngữ nghĩa ảnh vệ tinh. Không giống như các phương pháp dựa trên tái tạo như Bộ mã hóa tự động có mặt nạ (MAE) hiện có, chúng tôi áp dụng phương pháp LOCA (nhận biết vị trí) dựa trên dự đoán vị trí cho dữ liệu đa phương thức của ảnh vệ tinh. Cụ thể, chúng tôi mở rộng nhóm kênh của SatMAE từ đa phổ sang đa phương thức và giới thiệu mặt nạ chú ý cùng nhóm để tăng cường tương tác giữa các phương thức. Chúng tôi nâng cao khả năng suy luận không gian tập trung vào định vị thông qua dự đoán vị trí bản vá tương đối. Chúng tôi chứng minh rằng phương pháp này vượt trội đáng kể so với phương pháp học tự giám sát dựa trên tái tạo hiện có trên tập dữ liệu lập bản đồ lũ lụt Sen1Floods11. Kết quả là, chúng tôi chứng minh rằng tác vụ dự đoán vị trí được áp dụng đúng cách cho ảnh vệ tinh đa phương thức sẽ học được các biểu diễn hiệu quả hơn cho phân đoạn ngữ nghĩa ảnh vệ tinh so với phương pháp dựa trên tái tạo.

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày một phương pháp học tự giám sát hiệu quả để phân đoạn ngữ nghĩa các hình ảnh vệ tinh đa phương thức.
Chúng tôi chứng minh bằng thực nghiệm rằng phương pháp học tự giám sát dựa trên dự đoán vị trí hiệu quả hơn phương pháp dựa trên tái tạo để phân đoạn ảnh vệ tinh.
Chúng tôi trình bày các kỹ thuật mới để xử lý dữ liệu đa phương thức và tăng cường tương tác giữa các phương thức.
Limitations:
Hiệu suất của phương pháp đề xuất dựa trên kết quả trên một tập dữ liệu cụ thể (Sen1Floods11) và hiệu suất tổng quát hóa cho các tập dữ liệu khác cần được nghiên cứu thêm.
Thiếu phân tích so sánh với các phương pháp học tự giám sát dựa trên dự đoán vị trí khác.
Kết quả thử nghiệm trên các tập dữ liệu lớn không được trình bày.
👍