FineMolTex는 분자 그래프와 텍스트 설명을 통합하여 분자 표현 학습을 향상시키는 새로운 미세 입자 분자 그래프-텍스트 사전 학습 프레임워크입니다. 기존 연구들이 전체 분자 그래프에만 집중한 것과 달리, FineMolTex는 분자 특성 결정에 필수적인 모티프(반복되는 하위 그래프)에 대한 미세 입자 지식을 학습합니다. 두 가지 사전 학습 작업, 즉 조잡한 매칭을 위한 대조 정렬 작업과 미세 입자 매칭을 위한 마스크된 다중 모드 모델링 작업으로 구성됩니다. 특히, 후자는 중요도에 따라 선택된 마스크된 모티프와 단어의 레이블을 예측합니다. 이를 통해 모티프와 단어 간의 미세 입자 매칭을 이해합니다.