この研究は、年齢や性別などの人口統計学的特性に特化した基盤モデルであるGeneral Demographic Pre-trained(GDP)モデルの開発を探ります。さまざまな病気と人口構成を持つデータセットを活用してモデルを事前学習して評価し、GDPアーキテクチャ構成のために順序付け方法とエンコード方法を組み合わせて、表形式の人口統計入力を効果的な潜在埋め込みに変換する方法を探求しました。その結果、GDPは、作業、病気、人口集団全体で一般化の可能性を実証しました。特に、逐次ソート方式は、リスク階層化の年齢と性別が重要な疾患でモデルのパフォーマンスを向上させ、人口統計学的特性が比較的低い予測値を持つデータセットでも表現的重要性を高めました。