GLProtein est le premier framework d'apprentissage global des protéines, intégrant à la fois la similarité structurale globale et les informations locales sur les acides aminés afin d'améliorer la précision des prédictions et les connaissances fonctionnelles. Outre l'analyse traditionnelle des séquences protéiques, il exploite non seulement les informations structurales 3D, mais aussi les informations locales au niveau moléculaire des acides aminés et les informations globales telles que la similarité structurale protéine-protéine. En combinant de manière innovante la modélisation protéique masquée, la notation de similarité structurale des triplets, le codage des distances 3D et le codage moléculaire des acides aminés basé sur les sous-structures, il surpasse les méthodes existantes dans diverses tâches bioinformatiques, notamment la prédiction des interactions protéine-protéine et des contacts.