Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Holistic Surgical Phase Recognition with Hierarchical Input Dependent State Space Models

Created by
  • Haebom

作者

Haoyang Wu, Tsun-Hsuan Wang, Mathias Lechner, Ramin Hasani, Jennifer A. Eckhoff, Paul Pak, Ozanan R. Meireles, Guy Rosman, Yutong Ban, Daniela Rus

概要

本論文は、ロボット手術の手術プロセス分析において、手術画像の長い持続時間による困難を解決するために階層入力依存状態空間モデルを提案する。既存のTransformerモデルの制限的な処理速度の問題を解決するために、線形スケーリング特性を持つ状態空間モデルを活用して、全画像に対する意思決定を可能にする。これは、局所的およびグローバルな動力学の両方を捕捉する時間的一貫性を維持する視覚的特徴抽出器を統合し、局所的動力学を効果的に捕捉する局所集約状態空間モデルブロックと、画像全体の時間的依存性をモデル化するグローバル関係状態空間モデルブロックとからなる。離散的および連続的な指導方式を組み合わせたハイブリッド学習戦略を使用し、Cholec80、MICCAI2016、Heicholeデータセットで従来の最高性能モデルよりもかなり向上した結果を示した。

Takeaways、Limitations

Takeaways:
ロボット手術画像解析における長い画像処理の難しさを効果的に解決する新しいアプローチの提示
状態空間モデルの利点を活用し、効率的な演算と精度向上を同時に達成。
局所的およびグローバルな動力学の両方を考慮した手術過程分析の精度向上
ハイブリッドマップ方式によるモデルパフォーマンスの向上。
さまざまなデータセットで従来の最高性能モデルと比較して性能向上を実験的に検証。
Limitations:
コード公開は論文採用以来、現在はコードアクセス不可。
様々な手術タイプの一般化性能に関する追加研究の必要性
状態空間モデルの複雑さと学習時間の追加分析が必要
👍