Sign In

Multimodal Optimal Transport for Training-free Temporal Segmentation in Surgical Robotics

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Omar Mohamed, Edoardo Fazzari, Ayah Al-Naji, Hamdan Alhadhrami, Khalfan Hableel, Saif Alkindi, Ivan Laptev, Cesare Stefanini

πŸ’‘ κ°œμš”

λ³Έ 논문은 λ‘œλ΄‡ 수술 μ˜μƒμ—μ„œ 수술 단계 및 과정을 μžλ™μœΌλ‘œ μΈμ‹ν•˜λŠ” μƒˆλ‘œμš΄ annotation-free ν”„λ ˆμž„μ›Œν¬μΈ TASOT(Text-Augmented Action Segmentation Optimal Transport)λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. TASOTλŠ” μ‹œκ° 정보와 ν…μŠ€νŠΈ 정보λ₯Ό μœ΅ν•©ν•˜κΈ° μœ„ν•΄, μ˜μƒμ—μ„œ μƒμ„±λœ ν…μŠ€νŠΈ μ„€λͺ…κ³Ό μ‹œκ° νŠΉμ§•μ„ Gromov-Wasserstein 졜적 μˆ˜μ†‘ 이둠 λ‚΄μ—μ„œ ν†΅ν•©ν•©λ‹ˆλ‹€. 이λ₯Ό 톡해 수술 κ΄€λ ¨ μ£Όμ„μ΄λ‚˜ 도메인 νŠΉν™” 사전 ν•™μŠ΅ 없이도 μ •λ°€ν•œ 수술 μ›Œν¬ν”Œλ‘œμš° 이해λ₯Ό κ°€λŠ₯ν•˜κ²Œ ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
기쑴의 λŒ€κ·œλͺ¨ 주석 데이터 λ˜λŠ” 도메인 νŠΉν™” 사전 ν•™μŠ΅μ΄ ν•„μš”ν•œ 수술 μ˜μƒ λΆ„ν•  λ°©λ²•λ‘ μ˜ ν•œκ³„λ₯Ό κ·Ήλ³΅ν•©λ‹ˆλ‹€.
β€’
μ‹œκ° 정보와 ν…μŠ€νŠΈ 정보λ₯Ό 효과적으둜 μœ΅ν•©ν•˜μ—¬ annotation-free λ°©μ‹μœΌλ‘œλ„ 높은 μ„±λŠ₯을 달성할 수 μžˆμŒμ„ μž…μ¦ν–ˆμŠ΅λ‹ˆλ‹€.
β€’
λ‹€μ–‘ν•œ 수술 λ‘œλ΄‡ ν”Œλž«νΌ 및 μž„μƒ ν™˜κ²½μ— μ‰½κ²Œ 적용될 수 μžˆλŠ” μ‹€μš©μ μΈ μ†”λ£¨μ…˜μ„ μ œμ‹œν•©λ‹ˆλ‹€.
β€’
ν…μŠ€νŠΈ 생성 λͺ¨λΈμ˜ μ„±λŠ₯κ³Ό ν…μŠ€νŠΈμ™€ μ‹œκ° 정보 κ°„μ˜ μ •λ ¬ 정확도가 TASOT의 μ „λ°˜μ μΈ μ„±λŠ₯에 영ν–₯을 λ―ΈμΉ  수 있으며, μ΄λŠ” ν–₯ν›„ 연ꡬ κ³Όμ œκ°€ 될 수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘