Para abordar los desafíos del desarrollo de algoritmos de inteligencia artificial (IA) que desempeñan un papel clave en las tecnologías de salud digital de vanguardia para el manejo de la diabetes, este documento presenta la colección Glucose-ML, que incluye 10 conjuntos de datos de diabetes disponibles públicamente publicados entre 2018 y 2025. Glucose-ML contiene más de 3 millones de días de datos de monitoreo continuo de glucosa (MCG) (38 millones de muestras de glucosa en sangre en total) de más de 2500 pacientes con diabetes tipo 1, diabetes tipo 2, prediabetes y no diabéticos de cuatro países. Para ayudar a los investigadores a utilizar eficazmente este conjunto de datos, proporcionamos un análisis comparativo de los conjuntos de datos y un estudio de caso centrado en la tarea de IA de predicción de glucosa en sangre. A través del estudio de caso, demostramos que los resultados de la predicción pueden variar significativamente según el conjunto de datos, incluso para el mismo algoritmo, y proporcionamos recomendaciones para desarrollar soluciones robustas de IA basadas en esto. Proporcionamos enlaces y código para todos los conjuntos de datos.