GLProtein은 단백질의 전구 학습을 위한 최초의 프레임워크로, 단백질의 전역 구조적 유사성과 국소 아미노산 정보를 모두 통합하여 예측 정확도와 기능적 통찰력을 향상시킵니다. 기존의 단백질 서열 분석에 더해 3차원 구조 정보뿐 아니라 아미노산 분자 수준의 국소 정보와 단백질-단백질 구조 유사성과 같은 전역 정보를 활용합니다. 마스크된 단백질 모델링, 삼중항 구조 유사성 점수 매기기, 3D 거리 인코딩, 하위 구조 기반 아미노산 분자 인코딩을 혁신적으로 결합하여 단백질-단백질 상호작용 예측, 접촉 예측 등 여러 생물정보학 작업에서 기존 방법보다 우수한 성능을 보입니다.