[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Synthesizing Reality: Leveraging the Generative AI-Powered Platform Midjourney for Construction Worker Detection

Created by
  • Haebom

作者

Hongyang Zhao, Tianyu Liang, Sina Davari, Daeho Kim

概要

本稿では、建設現場の労働者を検出するための新しい画像合成方法論を紹介します。 Midjourneyという生成されたAIプラットフォームを活用して、3000の異なるプロンプトで12,000の合成画像を生成し、手動ラベリング後にDNNトレーニングデータセットとして活用しました。実際の建設イメージデータセットで評価した結果、IoUしきい値0.5〜0.937の平均精度(AP)、0.5〜0.95〜0.642のAPを達成しました。合成データセットでは、0.994と0.919のAPを達成し、高いパフォーマンスを示しました。これは、生成型AIがDNNトレーニングデータ不足の問題を解決できる可能性と限界を同時に示しています。

Takeaways、Limitations

Takeaways:
生成型AI(Midjourney)を活用して、建設現場の作業者の検出に必要なデータセットを効果的に生成できることを示しています。
合成データを活用したDNNトレーニングにより、実際のデータセットでも高い精度を達成できることを示唆。
生成されたAIベースのデータ拡張がDNNのパフォーマンス向上に貢献できることを示唆しています。
Limitations:
合成データと実際のデータとの間のドメインギャップのため、実際のデータセットのパフォーマンスは合成データセットと比較して比較的低いです。
手動ラベリングプロセスが必要なため、データセットの構築にかなりの労力と時間がかかる可能性があります。
Midjourneyなどの生成型AIの制限により、生成される画像の品質と多様性に制限がある可能性があります。
👍