Este estudio propone un marco para el ajuste fino de un modelo de lenguaje a gran escala (LLM) mediante privacidad diferencial (PD) para la clasificación multiobjeto a partir del texto de informes de imágenes médicas. Mediante la inyección de ruido compensado durante el proceso de ajuste fino, buscamos mitigar los riesgos de privacidad asociados con datos sensibles de pacientes y prevenir la fuga de datos, manteniendo al mismo tiempo el rendimiento de la clasificación. Utilizando 50.232 informes de imágenes médicas de los conjuntos de datos públicos de radiografías de tórax MIMIC-CXR y tomografía computarizada CT-RATE, recopilados entre 2011 y 2019, ajustamos el LLM mediante adaptación de baja dimensión de privacidad diferencial (PD-LoRA) en tres arquitecturas de modelo: BERT-mediana, BERT-pequeña y ALBERT-base, para clasificar 14 etiquetas del conjunto de datos MIMIC-CXR y 18 etiquetas del conjunto de datos CT-RATE. Evaluamos el rendimiento del modelo utilizando la puntuación F1 ponderada en varios niveles de privacidad (presupuesto de privacidad = {0,01, 0,1, 1,0, 10,0}) y comparamos el rendimiento del modelo en diferentes niveles de privacidad para cuantificar el equilibrio entre privacidad y utilidad. Los resultados experimentales revelaron un claro equilibrio entre privacidad y utilidad en dos conjuntos de datos diferentes y tres modelos diferentes. Con garantías de privacidad moderadas, el modelo ajustado con DP alcanzó puntuaciones F1 ponderadas de 0,88 para MIMIC-CXR y 0,59 para CT-RATE, lo que demuestra un rendimiento relativamente similar a los modelos de referencia LoRA sin preservación de la privacidad (0,90 y 0,78, respectivamente). En conclusión, el ajuste fino diferencial con preservación de la privacidad utilizando LoRA permite una clasificación multienfermedad eficaz y con preservación de la privacidad, lo que aborda los desafíos clave del ajuste fino de LLM en datos médicos sensibles.