Cet article présente une nouvelle approche pour relever les défis de l'acquisition d'images multimodales, malgré les progrès significatifs réalisés dans l'utilisation de l'imagerie médicale multimodale pour le diagnostic des maladies ophtalmiques. Plus précisément, pour remédier au déséquilibre entre les photographies du fond d'œil, relativement peu coûteuses et facilement disponibles, et les images OCT coûteuses, nous proposons un cadre multimodal non apparié, \UOPSL. UOPSL utilise les informations spatiales préalables (sites de prédilection) obtenues à partir des images OCT pour améliorer la reconnaissance des maladies à partir des images du fond d'œil. Grâce à l'apprentissage contrastif sur des images OCT et du fond d'œil non appariées à grande échelle, \UOPSL apprend les schémas de localisation des lésions dans l'espace latent OCT et utilise ces informations pour effectuer une classification des maladies uniquement sur les images du fond d'œil. Nous rapportons que notre approche surpasse les méthodes existantes sur neuf ensembles de données diversifiés englobant 28 catégories clés.