本論文は、糖尿病管理のための最先端のデジタル健康技術において重要な役割を果たす人工知能(AI)アルゴリズムの開発の難しさを解決するために、2018年から2025年までに発表された10個の公開糖尿病データセットを含むGlucose-MLコレクションを提示します。 Glucose-MLには、4カ国2500人以上の1型糖尿病、2型糖尿病、糖尿病前段階、および非糖尿病患者の300万日以上の連続血糖測定器(CGM)データ(合計3800万個の血糖サンプル)が含まれています。研究者がこのデータセットを効果的に活用できるように、データセット比較分析と血糖予測というAI課題を中心としたケーススタディを提供します。ケーススタディは、同じアルゴリズムでもデータセットによって予測結果が大きく異なる可能性があることを示しており、これに基づいて強力なAIソリューションを開発するための推奨事項を提示します。すべてのデータセットへのリンクとコードを公開します。