Este artículo presenta un enfoque basado en visión artificial para el diagnóstico de lesiones de muñeca en niños. Para abordar la falta de datos de imágenes médicas, utilizamos un enfoque multifacético que combina metadatos del paciente con imágenes de rayos X. Específicamente, utilizamos ponderaciones preentrenadas de un conjunto de datos de grano fino, en lugar de un conjunto de datos general como ImageNet, y definimos el problema como una tarea de reconocimiento de grano fino. A diferencia de estudios previos, somos los primeros en aplicar la integración de metadatos al reconocimiento de lesiones de muñeca, logrando una mejora en la precisión diagnóstica del 2 % en un conjunto de datos pequeño y de desarrollo propio y de más del 10 % en un conjunto de datos de fracturas a gran escala.