Cet article souligne l'importance de l'estimation de la profondeur en chirurgie endoscopique mini-invasive et présente une nouvelle stratégie d'ajustement fin utilisant le modèle de fondation pour surmonter les limites des réseaux d'estimation de profondeur conventionnels basés sur les CNN. Plus précisément, nous proposons un cadre d'estimation de profondeur monoculaire implicite non supervisé, basé sur le modèle Depth Anything, pour une estimation optimisée de la profondeur dans les images endoscopiques. Il intègre une technique d'adaptation de bas rang basée sur des vecteurs aléatoires et un bloc résiduel basé sur une convolution séparable en profondeur afin d'améliorer l'adaptabilité à différentes échelles et de pallier la limitation de l'apprentissage des caractéristiques locales du transformateur. Les résultats expérimentaux sur les jeux de données SCARED et Hamlyn démontrent que la méthode proposée atteint des performances de pointe tout en minimisant le nombre de paramètres apprenables.