Cet article présente une approche basée sur la vision par ordinateur pour le diagnostic des lésions du poignet chez l'enfant. Pour pallier le manque de données d'imagerie médicale, nous utilisons une approche multidimensionnelle combinant les métadonnées des patients avec des images radiographiques X. Plus précisément, nous utilisons des pondérations pré-entraînées issues d'un jeu de données à granularité fine, plutôt que d'un jeu de données général comme ImageNet, et définissons le problème comme une tâche de reconnaissance à granularité fine. Contrairement aux études précédentes, nous sommes les premiers à appliquer l'intégration des métadonnées à la reconnaissance des lésions du poignet, obtenant une amélioration de la précision diagnostique de 2 % sur un petit jeu de données auto-construit et de plus de 10 % sur un jeu de données de fractures à grande échelle.