Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

VisioFirm: Công cụ chú thích hỗ trợ AI đa nền tảng cho thị giác máy tính

Created by
  • Haebom

Tác giả

Safouane El Ghazouali, Umberto Michelucci

Phác thảo

VisioFirm là một ứng dụng web nguồn mở giúp đơn giản hóa việc gắn nhãn hình ảnh thông qua tự động hóa được hỗ trợ bởi AI. Ứng dụng tích hợp các mô hình nền tảng tiên tiến, chẳng hạn như mô hình CLIP và Ultralytics, và Grounding DINO, để tạo chú thích ban đầu và tối đa hóa khả năng thu hồi bằng ngưỡng tin cậy thấp. Người dùng có thể tinh chỉnh chú thích bằng các công cụ tương tác hỗ trợ hộp giới hạn, hộp giới hạn định hướng và đa giác, đồng thời cung cấp khả năng phân đoạn theo thời gian thực bằng Segment Anything, được tăng tốc bởi WebGPU. Ứng dụng hỗ trợ nhiều định dạng xuất, bao gồm YOLO, COCO, Pascal VOC và CSV, và hoạt động ngoại tuyến sau khi lưu trữ mô hình. Các bài kiểm tra trên nhiều tập dữ liệu khác nhau đã cho thấy ứng dụng giúp giảm thiểu thao tác thủ công tới 90% mà vẫn duy trì độ chính xác chú thích cao.

Takeaways, Limitations

Takeaways:
Tự động hóa dựa trên AI có thể cải thiện đáng kể hiệu quả của việc dán nhãn hình ảnh.
Tính linh hoạt cao với khả năng hỗ trợ nhiều loại chú thích khác nhau (hộp giới hạn, hộp giới hạn định hướng, đa giác, phân đoạn) và định dạng xuất.
Cải thiện khả năng truy cập bằng cách hỗ trợ hoạt động ngoại tuyến.
Phương pháp này cho thấy hiệu quả giảm khối lượng công việc lên đến 90% so với cách dán nhãn thủ công hiện nay.
ĐâY là mã nguồn mở và bất kỳ ai cũng có thể sử dụng.
_____T279004____-:
Hiệu suất hiện tại dựa trên kết quả thử nghiệm cho các lớp kiểu COCO và hiệu suất trên các loại tập dữ liệu khác cần được xác thực thêm.
Nếu dự đoán ban đầu không chính xác, người dùng có thể cần phải điều chỉnh đáng kể.
Độ Chính xác của chú thích có thể giảm đối với những hình ảnh phức tạp hoặc các lớp đặc biệt.
Hiệu suất tối ưu chỉ có trong môi trường trình duyệt được WebGPU hỗ trợ.
👍