VisioFirmは、AIベースの自動化を介して画像のラベリングを簡素化するオープンソースWebアプリケーションです。 CLIPとUltralyticsモデル、Grounding DINOなどの最先端ベースのモデルを統合して初期アノテーションを作成し、信頼性の低いしきい値を使用して再現率を最大化します。ユーザーは、境界ボックス、方向境界ボックス、およびポリゴンをサポートするインタラクティブツールを使用してアノテーションを変更でき、WebGPUを介して高速化されたSegment Anythingを使用したリアルタイム分割機能も提供します。 YOLO、COCO、Pascal VOC、CSVなど、さまざまなエクスポート形式をサポートし、モデルキャッシュ後にオフラインで動作します。さまざまなデータセットのベンチマークの結果、手動操作を最大90%削減し、高い注釈精度を維持することがわかりました。