[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Modèle avancé de profondeur pour l'estimation monoculaire non supervisée de la profondeur en endoscopie

Created by
  • Haebom

Auteur

Bojian Li, Bo Liu, Xinning Yao, Jinghua Yue et Fugen Zhou

Contour

Cet article souligne l'importance de l'estimation de la profondeur en chirurgie endoscopique mini-invasive et présente une nouvelle stratégie d'ajustement fin utilisant le modèle de fondation pour surmonter les limites des réseaux d'estimation de profondeur conventionnels basés sur les CNN. Plus précisément, nous proposons un cadre d'estimation de profondeur monoculaire implicite non supervisé, basé sur le modèle Depth Anything, pour une estimation optimisée de la profondeur dans les images endoscopiques. Il intègre une technique d'adaptation de bas rang basée sur des vecteurs aléatoires et un bloc résiduel basé sur une convolution séparable en profondeur afin d'améliorer l'adaptabilité à différentes échelles et de pallier la limitation de l'apprentissage des caractéristiques locales du transformateur. Les résultats expérimentaux sur les jeux de données SCARED et Hamlyn démontrent que la méthode proposée atteint des performances de pointe tout en minimisant le nombre de paramètres apprenables.

Takeaways, Limitations_

Takeaways:
Nous avons amélioré les performances d’estimation de la profondeur des images endoscopiques en utilisant le modèle de fondation.
Nous avons amélioré l’efficacité et la précision du modèle grâce à des techniques d’adaptation de bas rang et à des blocs résiduels basés sur la convolution séparables en profondeur.
Il peut contribuer à améliorer la précision et la sécurité de la chirurgie endoscopique mini-invasive.
Nous obtenons des performances de pointe avec un minimum de paramètres d'apprentissage.
Limitations:
Les performances de la méthode proposée sont basées sur des résultats sur des ensembles de données spécifiques (SCARED et Hamlyn), et les performances de généralisation sur d'autres ensembles de données nécessitent une étude plus approfondie.
Une évaluation plus approfondie de la robustesse à diverses conditions des images endoscopiques (éclairage, mouvement, etc.) est nécessaire.
La vérification des performances de traitement en temps réel dans un environnement chirurgical réel est nécessaire.
👍