Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

VisioFirm: Herramienta multiplataforma de anotación asistida por IA para visión artificial

Created by
  • Haebom

Autor

Safouane El Ghazouali, Umberto Michelucci

Describir

VisioFirm es una aplicación web de código abierto que optimiza el etiquetado de imágenes mediante la automatización basada en IA. Integra modelos fundamentales de vanguardia, como los modelos CLIP y Ultralytics, y Grounding DINO, para generar anotaciones iniciales y maximizar la recuperación con un umbral de confianza bajo. Los usuarios pueden refinar las anotaciones con herramientas interactivas compatibles con cuadros delimitadores, cuadros delimitadores orientados y polígonos, y también ofrece segmentación en tiempo real mediante Segment Anything, acelerado por WebGPU. Admite múltiples formatos de exportación, como YOLO, COCO, Pascal VOC y CSV, y funciona sin conexión tras el almacenamiento en caché del modelo. Las pruebas comparativas con diversos conjuntos de datos han demostrado que reduce el esfuerzo manual hasta en un 90 %, manteniendo una alta precisión de anotación.

Takeaways, Limitations

Takeaways:
La automatización basada en IA puede mejorar significativamente la eficiencia del etiquetado de imágenes.
Alta flexibilidad con soporte para varios tipos de anotación (cuadro delimitador, cuadro delimitador orientado, polígono, segmentación) y formatos de exportación.
Accesibilidad mejorada al soportar el funcionamiento sin conexión.
Muestra un efecto de reducción de la carga de trabajo de hasta un 90% en comparación con el etiquetado manual existente.
Es de código abierto y puede ser utilizado por cualquiera.
Limitations:
El rendimiento actual se basa en los resultados de pruebas para clases de tipo COCO, y el rendimiento en otros tipos de conjuntos de datos requiere mayor validación.
Si la predicción inicial no es precisa, es posible que el usuario deba realizar correcciones importantes.
Existe la posibilidad de que la precisión de anotación sea reducida para imágenes complejas o clases especiales.
Rendimiento óptimo solo en entornos de navegador compatibles con WebGPU.
👍