[공지사항]을 빙자한 안부와 근황 
Show more

Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Tổng hợp thực tế: Tận dụng nền tảng AI tạo sinh Midjourney để phát hiện công nhân xây dựng

Created by
  • Haebom

Tác giả

Hongyang Zhao, Tianyu Liang, Sina Davari, Daeho Kim

Phác thảo

Bài báo này trình bày một phương pháp tổng hợp hình ảnh mới để phát hiện công nhân xây dựng. Sử dụng nền tảng AI sinh học có tên là Midjourney, chúng tôi tạo ra 12.000 hình ảnh tổng hợp với 3.000 lời nhắc khác nhau, sau đó được dán nhãn thủ công và sử dụng làm tập dữ liệu huấn luyện DNN. Khi được đánh giá trên một tập dữ liệu hình ảnh xây dựng thực tế, chúng tôi đạt được độ chính xác trung bình (AP) là 0,937 ở ngưỡng IoU là 0,5 và AP là 0,642 trong khoảng từ 0,5 đến 0,95. Trên tập dữ liệu tổng hợp, chúng tôi đạt hiệu suất cao với AP lần lượt là 0,994 và 0,919. Điều này chứng minh cả tiềm năng và hạn chế của AI sinh học trong việc giải quyết vấn đề thiếu dữ liệu huấn luyện DNN.

Takeaways, Limitations

Takeaways:
Chúng tôi chứng minh rằng AI tạo sinh (Midjourney) có thể được sử dụng để tạo ra các tập dữ liệu cần thiết cho việc phát hiện công nhân công trường xây dựng một cách hiệu quả.
Đề Xuất rằng độ chính xác cao có thể đạt được ngay cả trên các tập dữ liệu thực bằng cách đào tạo DNN bằng dữ liệu tổng hợp.
Chúng tôi cho rằng việc tăng cường dữ liệu dựa trên AI có thể góp phần cải thiện hiệu suất DNN.
Limitations:
Do khoảng cách miền giữa dữ liệu tổng hợp và dữ liệu thực, hiệu suất trên các tập dữ liệu thực thấp hơn tương đối so với trên các tập dữ liệu tổng hợp.
Việc xây dựng một tập dữ liệu có thể tốn nhiều công sức và thời gian vì nó đòi hỏi phải có quy trình dán nhãn thủ công.
Do những hạn chế trong AI tạo hình như Midjourney, chất lượng và tính đa dạng của hình ảnh được tạo ra có thể bị hạn chế.
👍