본 논문은 단백질 기능 예측을 위한 새로운 프레임워크인 Diffused and Aligned Multi-modal Protein Embedding (DAMPE)를 제안합니다. DAMPE는 서로 다른 내재적 신호(서열, 구조 등)와 외부 컨텍스트(단백질-단백질 상호작용, GO 용어 주석 등)를 효과적으로 통합합니다. 이를 위해, (i) 사전 훈련된 인코더로 생성된 임베딩 간의 상호 모드 분포 불일치를 해결하기 위한 Optimal Transport (OT) 기반 표현 정렬, (ii) 정보적 단서를 제공하는 조건 인코더를 통해 그래프 재구성을 유도하는 Conditional Graph Generation (CGG) 기반 정보 융합 방법을 사용합니다. 실험 결과 DAMPE는 기존 방법들을 능가하는 성능을 보였으며, OT 기반 정렬과 CGG 기반 융합의 효과를 입증했습니다.