FineMolTex는 분자 그래프와 그에 대한 텍스트 설명을 결합하여 분자 표현 학습을 향상시키는 새로운 프레임워크입니다. 기존 연구들이 전체 분자 그래프에 집중하는 것과 달리, FineMolTex는 분자 특성 결정에 중요한 역할을 하는 모티프(반복되는 하위 그래프)에 대한 미세한 수준의 지식을 학습합니다. 두 가지 사전 학습 과제, 즉 조잡한 수준의 매칭을 위한 대조적 정렬 과제와 미세한 수준의 매칭을 위한 마스크된 다모달 모델링 과제를 통해 분자 수준의 조잡한 지식과 모티프 수준의 미세한 지식을 함께 학습합니다. 특히, 후자 과제는 중요도에 따라 선택된 마스크된 모티프와 단어의 레이블을 예측합니다. 세 가지 하위 작업에 대한 광범위한 실험을 통해 텍스트 기반 분자 편집 작업에서 최대 238%의 성능 향상을 달성했습니다.