Este artículo presenta un modelo de sensor a gran escala (CGM-LSM) preentrenado con registros de monitorización continua de glucosa (MCG) de 1,6 millones de pacientes con diversos tipos de diabetes. Inspirado en el paradigma autorregresivo de los modelos de lenguaje a gran escala, el CGM-LSM, basado en un decodificador Transformer, modela a los pacientes como una secuencia de intervalos de tiempo de glucosa en sangre, aprendiendo conocimiento latente integrado en los datos de CGM y prediciendo los niveles de glucosa en sangre en un horizonte de predicción de 2 horas. En comparación con los métodos existentes, el CGM-LSM mejora significativamente la precisión y robustez de la predicción, reduciendo el error cuadrático medio en un 48,51 % en el horizonte de predicción de 1 hora y demostrando un rendimiento de predicción constante en el grupo de pacientes de reserva. Además, analizamos las variaciones en el rendimiento del modelo en los subgrupos de pacientes y escenarios de predicción, destacando las principales oportunidades y desafíos para el avance de los modelos basados en CGM.