Foundation Molecular Grammar: Multi-Modal Foundation Models Induce Interpretable Molecular Graph Languages
Created by
Haebom
저자
Michael Sun, Weize Yuan, Gang Liu, Wojciech Matusik, Jie Chen
개요
본 논문은 데이터 효율적인 분자 생성을 위해 해석 가능성을 도입하는 그래프 문법을 활용하는 최근 접근 방식에 대해 다룹니다. 기존 접근 방식은 전문가의 주석이나 신뢰할 수 없는 알고리즘적 추론 휴리스틱에 의존하는 문법 학습에 의존하는 한계를 가지고 있습니다. 본 논문에서는 다중 모달 기반 모델(MMFMs)을 활용하여 해석 가능한 분자 언어를 유도하는 Foundation Molecular Grammar (FMG)를 제안합니다. MMFM의 화학적 지식을 활용하여 FMG는 분자를 이미지로 렌더링하고 텍스트로 설명하며 프롬프트 학습을 사용하여 모달 간 정보를 정렬합니다. FMG는 분자 생성 및 특성 예측에서 기존 문법 학습 접근 방식을 대체할 수 있습니다. 본 논문은 FMG가 합성 가능성, 다양성 및 데이터 효율성 측면에서 우수할 뿐만 아니라 자동화된 분자 발견 워크플로우를 위한 내장된 화학적 해석 가능성을 제공함을 보여줍니다. 코드는 https://github.com/shiningsunnyday/induction 에서 이용 가능합니다.
시사점, 한계점
•
시사점:
◦
다중 모달 기반 모델을 이용한 해석 가능한 분자 언어 유도를 통한 데이터 효율적인 분자 생성 및 특성 예측 가능성 제시.
◦
기존 그래프 문법 학습 방식의 한계점인 전문가 주석 및 비신뢰할 수 있는 휴리스틱 의존성 극복.