Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Mở rộng Bộ ước tính độ sâu đơn sắc cơ bản sang Máy ảnh mắt cá với Mã thông báo hiệu chuẩn

Created by
  • Haebom

Tác giả

Suchisrit Gangopadhyay,Jung-Hee Kim,Xien Chen,Patrick Rim,Hyoungseob Park,Alex Wong

Phác thảo

Bài báo này đề xuất một phương pháp để điều chỉnh các bộ ước lượng độ sâu đơn sắc cơ bản (FMDE), được huấn luyện trên ảnh phối cảnh thông thường, sang ảnh mắt cá. Mặc dù được huấn luyện trên hàng chục triệu ảnh, FMDE dễ bị dịch chuyển biến số do thay đổi các tham số hiệu chuẩn máy ảnh (nội tại và biến dạng), dẫn đến ước tính độ sâu không chính xác. Phương pháp chúng tôi đề xuất căn chỉnh phân bố nhúng tiềm ẩn mã hóa ảnh mắt cá với phân bố nhúng tiềm ẩn của ảnh phối cảnh, cho phép tái sử dụng FMDE trên máy ảnh mắt cá mà không cần huấn luyện lại hoặc tinh chỉnh. Để đạt được điều này, chúng tôi giới thiệu một bộ mã hiệu chuẩn như một cơ chế thích ứng nhẹ, điều chỉnh các nhúng tiềm ẩn để đạt được sự căn chỉnh. Chúng tôi đưa ra giả thuyết rằng bằng cách tận dụng không gian tiềm ẩn vốn đã biểu cảm của FMDE, chúng tôi có thể tránh được những tác động tiêu cực của việc hiệu chuẩn lại thông thường hoặc phép chiếu bản đồ từ không gian ảnh sang khung tham chiếu chuẩn. Phương pháp của chúng tôi sử dụng học tự giám sát và sử dụng một tập dữ liệu ảnh phối cảnh lớn, có sẵn công khai mà không yêu cầu ảnh mắt cá. Điều này được thực hiện bằng cách hiệu chuẩn lại ảnh phối cảnh thành ảnh mắt cá và tăng cường tính nhất quán giữa các ước tính trong quá trình huấn luyện. Chúng tôi đã đánh giá phương pháp này trong cả môi trường trong nhà và ngoài trời bằng cách sử dụng nhiều FMDE, chứng minh hiệu suất được cải thiện nhất quán so với các phương pháp tiên tiến chỉ với một bộ mã thông báo. Mã có sẵn tại _____T119172____- .

Takeaways, Limitations

Takeaways:
Bằng cách áp dụng mô hình ước tính độ sâu đơn sắc hiện có vào hình ảnh mắt cá, có thể mở rộng nhiều lĩnh vực ứng dụng khác nhau bằng cách sử dụng camera mắt cá.
Khả năng thích ứng với hình ảnh mắt cá bằng cách sử dụng mã thông báo hiệu chỉnh nhẹ mà không cần đào tạo lại hoặc tinh chỉnh.
ĐạT được khả năng thích ứng hiệu quả và giảm thiểu hiện tượng nhiễu thông qua thao tác không gian tiềm ẩn mà không cần biến đổi không gian hình ảnh.
Phương pháp học tự giám sát cho phép học mà không cần tập dữ liệu hình ảnh mắt cá.
Limitations:
Cần nghiên cứu thêm để xác định hiệu suất tổng quát của mã thông báo hiệu chỉnh. Tính linh hoạt trên nhiều mẫu máy ảnh mắt cá và mức độ biến dạng cũng là điều cần thiết.
Hiệu suất của phương pháp đề xuất có thể phụ thuộc vào FMDE và tập dữ liệu hình ảnh phối cảnh được sử dụng.
Có thể cần phải đánh giá hiệu suất bổ sung bằng cách sử dụng bộ dữ liệu hình ảnh mắt cá thực.
👍