Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Accelerating Local AI on Consumer GPUs: A Hardware-Aware Dynamic Strategy for YOLOv10s

Created by
  • Haebom

作者

Mahmudul Islam Masum, Miad Islam, Arif I. Sarwat

概要

本論文は、消費者クラスのハードウェアにおけるオブジェクト検出器のベンチマーク性能と実際の実行可能性との間のギャップを解消することに焦点を当てています。 YOLOv10sのようなモデルはリアルタイムの速度を提供しますが、これらのパフォーマンス指標は通常、高性能デスクトップクラスのGPUで達成されています。 RTX 4060 GPUなどのリソース制約システムでは、計算速度ではなくシステムレベルのボトルネックがパフォーマンスの低下の主な原因であることを明らかにし、これを解決するためにモデル構造を変更せずに適用可能な2パス適応型参照アルゴリズムを提示します。このアルゴリズムは、高速低解像度パスと必要に応じて高解像度パスを活用して速度を向上させ、5000個の画像COCOデータセットでPyTorch Early-Exit基準と比べて1.85倍の速度向上と5.51%のmAP損失を達成しました。純粋なモデル最適化ではなく、ハードウェア認識推論戦略を通じてスループットを最大化する実用的で再現可能な方法を提示します。

Takeaways、Limitations

Takeaways:
消費者クラスのハードウェアにおけるリアルタイムオブジェクト検出性能を向上させるための実用的な方法を提示する。
モデル構造を変更せずに適用可能なTwo-Pass Adaptive Inferenceアルゴリズムの有効性証明。
ハードウェアボトルネックを考慮したハードウェア認識推論戦略の重要性の強調
Early-Exitと解像度適応型ルーティング戦略の比較分析による最適戦略選択基準の提示
Limitations:
5000画像のCOCOデータセットを使用することで、一般化の可能性をさらに検証する必要があります。
特定のGPU(RTX 4060)の結果であり、他のハードウェア環境でのパフォーマンスは追加の研究が必要です。
MAP損失が5.51%で、一部の精度低下が発生。より向上した精度と速度のバランス点の導出が必要。
アルゴリズムの適用範囲はオブジェクト検出に限定され,他のAIモデルに対する一般化可能性のレビューが必要である。
👍