Cet article propose DFI-OmniStereo, une nouvelle méthode de perception de profondeur omnidirectionnelle. Elle vise à générer des cartes de profondeur haute résolution grâce à une estimation stéréoscopique peu coûteuse basée sur des caméras omnidirectionnelles. Pour pallier les limites des méthodes existantes, nous utilisons un modèle de base pré-entraîné à grande échelle pour réaliser une estimation de profondeur monoculaire relative au sein d'une architecture d'appariement stéréoscopique basée sur l'optimisation itérative. Plus précisément, nous utilisons les caractéristiques de profondeur monoculaire relative via une stratégie d'apprentissage en deux étapes pour effectuer un réglage fin invariant à l'échelle. Sur le jeu de données réel Helvipad, nous obtenons des résultats de pointe, réduisant l'erreur d'échelle moyenne (MAE) de disparité d'environ 16 % par rapport à la méthode stéréoscopique omnidirectionnelle la plus performante.