VisioFirm est une application web open source qui simplifie l'étiquetage des images grâce à une automatisation optimisée par l'IA. Elle intègre des modèles fondamentaux de pointe, tels que CLIP et Ultralytics, ainsi que Grounding DINO, pour générer des annotations initiales et maximiser le rappel grâce à un seuil de confiance faible. Les utilisateurs peuvent affiner les annotations grâce à des outils interactifs prenant en charge les cadres englobants, les cadres englobants orientés et les polygones. Elle offre également une segmentation en temps réel grâce à Segment Anything, accélérée par WebGPU. Elle prend en charge plusieurs formats d'exportation, dont YOLO, COCO, Pascal VOC et CSV, et fonctionne hors ligne après la mise en cache du modèle. Des tests comparatifs sur divers jeux de données ont montré une réduction des tâches manuelles jusqu'à 90 % tout en maintenant une précision d'annotation élevée.