PhenoGnet은 유전자 기능 상호작용 네트워크와 인간 표현형 온톨로지(HPO)를 통합하여 질병 유사성을 예측하는 새로운 그래프 기반 대조 학습 프레임워크입니다. Graph Convolutional Networks (GCNs)와 Graph Attention Networks (GATs)를 사용하여 유전자와 표현형 그래프를 개별적으로 인코딩하는 intra-view 모델과, 대조 학습을 통해 유전자와 표현형 임베딩을 정렬하는 공유 가중치 다층 퍼셉트론(MLP)으로 구현된 cross-view 모델로 구성됩니다. 알려진 유전자-표현형 연관성을 양성 쌍으로, 무작위로 샘플링된 무관한 쌍을 음성 쌍으로 사용하여 모델을 학습시킵니다. 질병은 연관된 유전자 및/또는 표현형의 평균 임베딩으로 표현되며, 코사인 유사도를 통해 쌍별 유사성을 계산합니다. 1,100개의 유사한 질병 쌍과 866개의 비슷하지 않은 질병 쌍으로 구성된 기준 데이터 세트에서 평가한 결과, 유전자 기반 임베딩은 AUCPR 0.9012 및 AUROC 0.8764를 달성하여 기존 최첨단 방법을 능가했습니다. 특히, PhenoGnet은 직접적인 중복을 넘어 잠재적인 생물학적 관계를 포착하여 질병 유사성 예측을 위한 확장 가능하고 해석 가능한 솔루션을 제공합니다. 이러한 결과는 희귀 질환 연구 및 정밀 의학에서의 다운스트림 응용 프로그램에 대한 잠재력을 강조합니다.