본 논문은 자연 생성물 연구를 위한 기초 모델(NaFM)을 제시한다. 기존의 자연 생성물 연구를 위한 딥러닝 방법들이 특정 하위 작업에 맞춰 설계된 지도 학습 방식에 의존하여 일반화 성능이 낮고 성능 향상의 여지가 크다는 점을 지적한다. NaFM은 자연 생성물의 고유한 특성을 고려한 새로운 사전 학습 전략을 사용한다. 대조 학습과 마스크 그래프 학습 목표를 통합하여 분자 골격의 진화 정보와 측쇄 정보를 모두 포착한다. 다양한 하위 작업(분류, 유전자 및 미생물 수준 분석, 가상 스크리닝)에서 최첨단 성능을 달성하며, 특히 기존 모델이 자연 합성을 이해하는 데 부적절하다는 점을 보여준다. 결과적으로, NaFM은 효과적인 약물 후보 물질 식별을 위한 유익한 자연 생성물 표현을 제공한다.