[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Synthétiser la réalité : exploiter la plateforme générative à IA Midparcours pour la détection des travailleurs du bâtiment

Created by
  • Haebom

Auteur

Hongyang Zhao, Tianyu Liang, Sina Davari, Daeho Kim

Contour

Cet article présente une nouvelle méthodologie de synthèse d'images pour la détection des ouvriers de chantier. Grâce à une plateforme d'IA générative appelée Midjourney, nous générons 12 000 images synthétiques avec 3 000 messages différents, qui sont ensuite étiquetés manuellement et utilisés comme base de données d'entraînement DNN. Lors de l'évaluation sur une base de données d'images de chantier réelle, nous obtenons une précision moyenne (AP) de 0,937 à un seuil IoU de 0,5 et une AP de 0,642 entre 0,5 et 0,95. Sur la base de données synthétiques, nous obtenons des performances élevées avec des AP de 0,994 et 0,919 respectivement. Cela démontre à la fois le potentiel et les limites de l'IA générative pour pallier le manque de données d'entraînement DNN.

Takeaways, Limitations

Takeaways:
Nous démontrons que l’IA générative (Midjourney) peut être utilisée pour générer efficacement les ensembles de données nécessaires à la détection des travailleurs des chantiers de construction.
Suggérant qu'une grande précision peut être obtenue même sur des ensembles de données réels en formant des DNN à l'aide de données synthétiques.
Nous suggérons que l’augmentation des données basée sur l’IA générative peut contribuer à améliorer les performances du DNN.
Limitations:
En raison de l’écart de domaine entre les données synthétiques et les données réelles, les performances sur les ensembles de données réels sont relativement inférieures à celles sur les ensembles de données synthétiques.
La création d’un ensemble de données peut demander beaucoup d’efforts et de temps, car elle nécessite un processus d’étiquetage manuel.
En raison des limitations de l’IA générative telle que Midjourney, il peut y avoir des limitations dans la qualité et la variété des images générées.
👍