Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

TiS-TSL: Image-Label Supervised Surgical Video Stereo Matching via Time-Switchable Teacher-Student Learning

Created by
  • Haebom
Category
Empty

저자

Rui Wang, Ying Zhou, Hao Wang, Wenwei Zhang, Qiang Li, Zhiwei Wang

개요

최소 침습 수술(MIS)에서 스테레오 매칭은 차세대 내비게이션 및 증강 현실에 필수적입니다. 그러나 해부학적 제약으로 인해 조밀한 시차 감독이 거의 불가능하여, 일반적으로 내시경이 깊은 신체 공동으로 들어가기 전에 획득한 몇 가지 이미지 수준 레이블로 주석이 제한됩니다. TiS-TSL은 이미지 수준 감독의 한계를 극복하기 위해 제안된 시변 스위치 가능 교사-학생 학습 프레임워크로, 단일 아키텍처 내에서 유연한 시간적 모델링을 가능하게 하는 이미지 예측(IP), 정방향 비디오 예측(FVP) 및 역방향 비디오 예측(BVP)의 세 가지 모드로 작동합니다. TiS-TSL은 이미지-비디오(I2V) 단계와 비디오-비디오(V2V) 단계의 두 단계 학습 전략을 채택하여 시간적 시차 예측을 개선하고, 양방향 시공간적 일관성을 계산함으로써 프레임 간의 신뢰할 수 없는 영역을 식별하고, 잡음이 있는 비디오 수준의 의사 레이블을 필터링하며, 시간적 일관성을 강화합니다.

시사점, 한계점

시사점:
최소 침습 수술 환경에서 비디오 스테레오 매칭 문제 해결.
시간적 일관성을 고려한 새로운 TiS-TSL 프레임워크 제안.
이미지 기반 SOTA 대비 성능 향상 (TEPE, EPE 개선).
단일 아키텍처 내에서 IP, FVP, BVP 모드를 통합하여 유연한 시간적 모델링 가능.
양방향 시공간적 일관성 계산을 통해 잡음 제거 및 시간적 일관성 확보.
한계점:
논문에서 구체적인 한계점에 대한 언급은 없음.
👍