本論文は、グラフニューラルネットワーク(GNN)におけるサイズ誘導分布の移動の重要な課題と、これがより大きなグラフに対するGNNの一般化に与える影響について説明します。従来の研究は、分布移動の様々な仮定の下で行われ、GNNの一般化の可能性についての相反する結論をもたらした。そこで、本論文では、データ中心のアプローチを採用し、サイズ指向分布の移動の種類を特定し特性評価し、主に探索されていないスペクトルの観点からGNN性能への影響を探る。実際の生物学的データセットのグラフサイズのかなりの分散を利用して生物学的グラフを分析し、サブグラフパターン(例えば、平均サイクル長)によって生じるスペクトル差がより大きく見えないグラフにおいてGNN性能と強く相関することを見出した。これらの洞察に基づいて、重要なサブグラフパターンに対するGNNの認識を向上させるための3つのモデル独立戦略を提案し、サイズ集約的注意が最も効果的なアプローチであることを確認しました。 5つのデータセットで6つのGNNアーキテクチャと7つのモデルに依存しない戦略を使用した広範な実験は、提案されたサイズ集約的戦略がトレーニンググラフより2〜10倍大きいテストグラフでグラフ分類を大幅に改善し、強力なベースラインよりもF1スコアを最大8%向上させることを示しています。