Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

MambaNeXt-YOLO: A Hybrid State Space Model for Real-time Object Detection

Created by
  • Haebom

作者

Xiaochun Lei, Siqi Wu, Weilin Wu, Zetao Jiang

概要

本稿では、リアルタイムオブジェクト検出における限られた計算リソースの下で速度と精度のバランスをとる新しいフレームワークであるMambaNeXt-YOLOを提案します。従来のTransformerベースのアーキテクチャの高い計算複雑さの問題を解決するために、線形状態空間モデルであるMambaを活用して効率的なシーケンスモデリングを実装します。重要な貢献は3つで、CNNとMambaを統合したMambaNeXt Blockを通じて局所特徴と長距離依存性を効果的に捕捉し、マルチスケールオブジェクト検出を改善するMAFPN(Multi-branch Asymmetric Fusion Pyramid Network)を提示し、NVIDIA Jetson Xavier NXやOrin NXなど。 PASCAL VOCデータセットで31.9 FPSで66.6%mAPを達成し、事前トレーニングなしでパフォーマンスを示しました。

Takeaways、Limitations

Takeaways:
Mambaベースの効率的なリアルタイムオブジェクト検出フレームワークを提示することで、計算リソースが制限された環境でのオブジェクト検出パフォーマンスの向上に貢献します。
MambaNeXt BlockとMAFPNにより精度と速度のバランスを効果的に達成。
エッジデバイスにおけるリアルタイムオブジェクト検出の可能性を提示
事前トレーニングなしで優れた性能を達成。
Limitations:
PASCAL VOCデータセットのみを使用して評価されたため、他のデータセットでの一般化性能は追加の研究が必要です。
提案された方法の他の最先端モデルとの比較分析をより詳細に提示する必要がある。
MambaNeXt-YOLOのエッジデバイス配備の詳細な技術的説明の欠如
👍