Holistic Surgical Phase Recognition with Hierarchical Input Dependent State Space Models
Created by
Haebom
저자
Haoyang Wu, Tsun-Hsuan Wang, Mathias Lechner, Ramin Hasani, Jennifer A. Eckhoff, Paul Pak, Ozanan R. Meireles, Guy Rosman, Yutong Ban, Daniela Rus
개요
본 논문은 로봇 수술의 수술 과정 분석에 있어, 수술 영상의 긴 지속 시간으로 인한 어려움을 해결하기 위해 계층적 입력 의존 상태 공간 모델을 제안한다. 기존 Transformer 모델의 제한적인 처리 속도 문제를 해결하고자, 선형 스케일링 특성을 가진 상태 공간 모델을 활용하여 전체 영상에 대한 의사결정을 가능하게 한다. 이는 국소 및 전역 동역학을 모두 포착하는 시간적 일관성을 유지하는 시각적 특징 추출기를 통합하고, 국소 동역학을 효과적으로 포착하는 국소 집계 상태 공간 모델 블록과 전체 영상의 시간적 의존성을 모델링하는 전역 관계 상태 공간 모델 블록으로 구성된다. 이산 및 연속 지도 방식을 결합한 하이브리드 학습 전략을 사용하며, Cholec80, MICCAI2016, Heichole 데이터셋에서 기존 최고 성능 모델보다 상당히 향상된 결과를 보였다.
시사점, 한계점
•
시사점:
◦
로봇 수술 영상 분석에서 긴 영상 처리의 어려움을 효과적으로 해결하는 새로운 접근법 제시.