본 논문은 유전자형-표현형 예측 모델의 한계점인 종 특이성과 고비용의 표현형 라벨링 문제를 해결하기 위해, 이미지를 형태학적 대리변수로 활용하는 새로운 접근법을 제시한다. 대규모 다중 모드 사전 학습을 통해 종 간 일반화를 가능하게 하는 유전자형-표현형 확산 모델(G2PDiffusion)을 제안하며, 다중 서열 정렬(MSA)과 환경적 맥락이라는 두 가지 중요한 진화적 신호를 고려하여 DNA로부터 형태 이미지를 생성한다. 모델은 MSA 검색 엔진, 환경 인식 MSA 조건부 인코더, 적응적 표현형 정렬 모듈의 세 가지 핵심 구성 요소로 이루어져 있으며, 진화적 신호와 환경적 맥락을 통합하여 종 간 표현형 변이에 대한 이해도를 높이고 향상된 AI 기반 유전체 분석을 위한 가능성을 제시한다.