Cet article met en évidence les défis des consultations dermatologiques à distance, notamment la nécessité d'établir un diagnostic avec des informations limitées (images et brèves descriptions). Pour y remédier, nous proposons un système d'IA médicale imitant le raisonnement clinique. Nous avons comparé et analysé sept modèles vision-langage dans six configurations : un modèle de base, un modèle affiné, un modèle avec une couche d'inférence supplémentaire et un modèle intégrant des fonctionnalités de recherche dans la littérature médicale. Si l'affinement a entraîné une baisse des performances, l'architecture imitant le raisonnement clinique a atteint une précision allant jusqu'à 70 % et a généré des résultats explicables et fondés sur la littérature, un élément crucial pour l'application clinique. Cela démontre que l'IA médicale peut réussir en repensant la pratique collaborative et fondée sur des preuves dans le diagnostic clinique.