VisioFirm es una aplicación web de código abierto que optimiza el etiquetado de imágenes mediante la automatización basada en IA. Integra modelos fundamentales de vanguardia, como los modelos CLIP y Ultralytics, y Grounding DINO, para generar anotaciones iniciales y maximizar la recuperación con un umbral de confianza bajo. Los usuarios pueden refinar las anotaciones con herramientas interactivas compatibles con cuadros delimitadores, cuadros delimitadores orientados y polígonos, y también ofrece segmentación en tiempo real mediante Segment Anything, acelerado por WebGPU. Admite múltiples formatos de exportación, como YOLO, COCO, Pascal VOC y CSV, y funciona sin conexión tras el almacenamiento en caché del modelo. Las pruebas comparativas con diversos conjuntos de datos han demostrado que reduce el esfuerzo manual hasta en un 90 %, manteniendo una alta precisión de anotación.