Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Holistic Surgical Phase Recognition with Hierarchical Input Dependent State Space Models

Created by
  • Haebom

저자

Haoyang Wu, Tsun-Hsuan Wang, Mathias Lechner, Ramin Hasani, Jennifer A. Eckhoff, Paul Pak, Ozanan R. Meireles, Guy Rosman, Yutong Ban, Daniela Rus

개요

본 논문은 로봇 수술의 수술 과정 분석에 있어, 수술 영상의 긴 지속 시간으로 인한 어려움을 해결하기 위해 계층적 입력 의존 상태 공간 모델을 제안한다. 기존 Transformer 모델의 제한적인 처리 속도 문제를 해결하고자, 선형 스케일링 특성을 가진 상태 공간 모델을 활용하여 전체 영상에 대한 의사결정을 가능하게 한다. 이는 국소 및 전역 동역학을 모두 포착하는 시간적 일관성을 유지하는 시각적 특징 추출기를 통합하고, 국소 동역학을 효과적으로 포착하는 국소 집계 상태 공간 모델 블록과 전체 영상의 시간적 의존성을 모델링하는 전역 관계 상태 공간 모델 블록으로 구성된다. 이산 및 연속 지도 방식을 결합한 하이브리드 학습 전략을 사용하며, Cholec80, MICCAI2016, Heichole 데이터셋에서 기존 최고 성능 모델보다 상당히 향상된 결과를 보였다.

시사점, 한계점

시사점:
로봇 수술 영상 분석에서 긴 영상 처리의 어려움을 효과적으로 해결하는 새로운 접근법 제시.
상태 공간 모델의 장점을 활용하여 효율적인 연산과 정확도 향상을 동시에 달성.
국소 및 전역 동역학을 모두 고려하여 수술 과정 분석의 정확성 향상.
하이브리드 지도 방식을 통해 모델 성능 향상.
다양한 데이터셋에서 기존 최고 성능 모델 대비 성능 향상을 실험적으로 검증.
한계점:
코드 공개는 논문 채택 이후로, 현재는 코드 접근 불가.
다양한 수술 유형에 대한 일반화 성능에 대한 추가적인 연구 필요.
상태 공간 모델의 복잡도와 학습 시간에 대한 추가적인 분석 필요.
👍