GNN-Suite은 계산 생물학에서 그래프 신경망(GNN) 아키텍처를 구축하고 벤치마킹하기 위한 강력하고 모듈화된 프레임워크입니다. Nextflow 워크플로우를 사용하여 GNN 성능을 평가함으로써 실험의 표준화와 재현성을 높였습니다. STRING과 BioGRID의 단백질-단백질 상호작용(PPI) 데이터로 분자 네트워크를 구축하고 PCAWG, PID, COSMIC-CGC 저장소의 특징으로 노드에 주석을 달아 암 유전자를 식별하는 데 유용성을 입증했습니다. GAT, GAT3H, GCN, GCN2, GIN, GTN, HGCN, PHGCN, GraphSAGE를 포함한 다양한 GNN 아키텍처와 기준 로지스틱 회귀(LR) 모델 간의 공정한 비교를 가능하게 합니다. 모든 GNN은 표준화된 2계층 모델로 구성되었고, 일관된 하이퍼파라미터(dropout = 0.2; Adam optimizer, learning rate = 0.01; 클래스 불균형을 해결하기 위한 조정된 이진 교차 엔트로피 손실)를 사용하여 80/20 train-test 분할로 300 에폭 동안 훈련되었습니다. 각 모델은 서로 다른 난수 시드를 사용한 10회의 독립 실행을 통해 평가되어 통계적으로 견고한 성능 지표(주요 지표는 균형 정확도(BACC))를 얻었습니다. STRING 기반 네트워크에서 GCN2가 가장 높은 BACC(0.807 +/- 0.035)를 달성했으며, 모든 GNN 유형이 LR 기준 모델보다 성능이 우수하여 네트워크 기반 학습의 장점을 강조했습니다. GNN-Suite는 공개적으로 제공되어 재현 가능한 연구를 촉진하고 계산 생물학에서 벤치마킹 표준을 개선하는 것을 목표로 합니다.