Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

VisioFirm: Cross-Platform AI-assisted Annotation Tool for Computer Vision

Created by
  • Haebom

作者

Safouane El Ghazouali, Umberto Michelucci

概要

VisioFirmは、AIベースの自動化を介して画像のラベリングを簡素化するオープンソースWebアプリケーションです。 CLIPとUltralyticsモデル、Grounding DINOなどの最先端ベースのモデルを統合して初期アノテーションを作成し、信頼性の低いしきい値を使用して再現率を最大化します。ユーザーは、境界ボックス、方向境界ボックス、およびポリゴンをサポートするインタラクティブツールを使用してアノテーションを変更でき、WebGPUを介して高速化されたSegment Anythingを使用したリアルタイム分割機能も提供します。 YOLO、COCO、Pascal VOC、CSVなど、さまざまなエクスポート形式をサポートし、モデルキャッシュ後にオフラインで動作します。さまざまなデータセットのベンチマークの結果、手動操作を最大90%削減し、高い注釈精度を維持することがわかりました。

Takeaways、Limitations

Takeaways:
AIベースの自動化により、画像ラベリングの効率を大幅に向上させることができます。
さまざまなアノテーションタイプ(境界ボックス、方向境界ボックス、多角形、分割)とエクスポート形式をサポートして柔軟性があります。
オフライン操作をサポートしてアクセシビリティを向上させます。
従来の手動ラベリングと比較して最大90%の作業量削減効果を見せました。
オープンソースで公開され、誰でも活用可能。
Limitations:
現在のパフォーマンスはCOCOタイプのクラスのテスト結果に基づいており、他のタイプのデータセットのパフォーマンスには追加の検証が必要です。
初期予測の精度が低い場合、ユーザーのかなりの修正作業が必要になることがあります。
複雑な画像や特殊なクラスのアノテーション精度が低下する可能性があります。
WebGPU対応ブラウザ環境でのみ最適なパフォーマンスを発揮します。
👍