Advancing Molecular Graph-Text Pre-training via Fine-grained Alignment

작성자

Haebom

카테고리

비어 있음

저자

Yibo Li, Yuan Fang, Mengmei Zhang, Chuan Shi

개요

FineMolTex는 분자 그래프와 텍스트 설명을 통합하여 분자 표현 학습을 향상시키는 새로운 미세 입자 분자 그래프-텍스트 사전 학습 프레임워크입니다. 기존 연구들이 전체 분자 그래프에 초점을 맞춘 것과 달리, FineMolTex는 분자 특성 결정에 중요한 역할을 하는 모티프(반복되는 부분 그래프)에 대한 미세 입자 지식을 학습합니다. 두 가지 사전 학습 과제(대조 정렬 과제와 마스크된 다중 모드 모델링 과제)를 통해 거시적 분자 수준 지식과 미세적 모티프 수준 지식을 동시에 학습합니다. 특히, 마스크된 다중 모드 모델링 과제는 중요도에 따라 선택된 마스크된 모티프와 단어의 레이블을 예측하여 모티프와 단어 간의 미세 입자 매칭을 이해합니다. 세 가지 하류 작업에 대한 실험 결과, 텍스트 기반 분자 편집 작업에서 최대 238%의 성능 향상을 달성했습니다.