GLProteinはタンパク質の前駆体学習のための最初のフレームワークで、タンパク質のグローバルな構造的類似性と局所アミノ酸情報の両方を統合して、予測精度と機能的洞察を向上させます。従来のタンパク質配列分析に加えて、三次元構造情報だけでなく、アミノ酸分子レベルの局所情報やタンパク質 - タンパク質構造類似性などのグローバル情報を活用します。マスクされたタンパク質モデリング、三重項構造類似性スコアリング、3D距離エンコード、サブ構造ベースのアミノ酸分子エンコードを革新的に組み合わせることで、タンパク質 - タンパク質相互作用予測、接触予測など、いくつかのバイオインフォマティクス作業で従来の方法より優れた性能を発揮します。