[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Sintetizando la realidad: Aprovechando la plataforma impulsada por IA generativa Midjourney para la detección de trabajadores de la construcción

Created by
  • Haebom

Autor

Hongyang Zhao, Tianyu Liang, Sina Davari, Daeho Kim

Describir

Este artículo presenta una novedosa metodología de síntesis de imágenes para la detección de trabajadores en obras de construcción. Utilizando una plataforma de IA generativa llamada Midjourney, generamos 12 000 imágenes sintéticas con 3000 indicaciones diferentes, que posteriormente se etiquetan manualmente y se utilizan como conjunto de datos de entrenamiento de DNN. Al evaluarlas con un conjunto de datos de imágenes de construcción reales, logramos una precisión media (PA) de 0,937 con un umbral de IoU de 0,5 y una PA de 0,642 entre 0,5 y 0,95. En el conjunto de datos sintéticos, logramos un alto rendimiento con PA de 0,994 y 0,919, respectivamente. Esto demuestra tanto el potencial como las limitaciones de la IA generativa para abordar la falta de datos de entrenamiento de DNN.

Takeaways, Limitations

Takeaways:
Demostramos que la IA generativa (Midjourney) se puede utilizar para generar eficazmente los conjuntos de datos necesarios para detectar trabajadores en obras de construcción.
Sugerimos que se puede lograr una alta precisión incluso en conjuntos de datos reales al entrenar DNN utilizando datos sintéticos.
Sugerimos que el aumento de datos basado en IA generativa puede contribuir a mejorar el rendimiento de DNN.
Limitations:
Debido a la brecha de dominio entre los datos sintéticos y los datos reales, el rendimiento en conjuntos de datos reales es relativamente menor que en conjuntos de datos sintéticos.
La creación de un conjunto de datos puede requerir mucho esfuerzo y tiempo, ya que requiere un proceso de etiquetado manual.
Debido a las limitaciones de la IA generativa como Midjourney, puede haber limitaciones en la calidad y variedad de las imágenes generadas.
👍