Atomas: Hierarchical Alignment on Molecule-Text for Unified Molecule Understanding and Generation
Created by
Haebom
Category
Empty
저자
Yikun Zhang, Geyan Ye, Chaohao Yuan, Bo Han, Long-Kai Huang, Jianhua Yao, Wei Liu, Yu Rong
개요
본 논문에서는 분자 표현의 질을 향상시키기 위해 SMILES 문자열과 텍스트로부터 계층적 분자 표현 학습 프레임워크인 Atomas를 제안합니다. 기존의 전역 정렬 방식의 한계를 극복하고자, 계층적 적응적 정렬 모델을 설계하여 분자와 텍스트의 미세 정보(fragment 및 입체 이성질체)를 세 가지 의미 수준에서 자동으로 정렬하고 학습합니다. Atomas는 분자 이해 및 생성을 지원하며, 다양한 하위 작업에 적용 가능합니다. 11개 데이터셋의 12개 작업에서 11개 기준 모델을 능가하는 성능을 보이며, 확장성 실험과 전문가 검증을 통한 시각화 및 정성적 분석을 통해 효과성과 화학적 타당성을 입증합니다. 코드는 깃허브에 공개되었습니다.
시사점, 한계점
•
시사점:
◦
계층적 적응적 정렬 모델을 통해 분자와 텍스트의 미세 정보(fragment, 입체 이성질체 등)를 효과적으로 학습 및 활용.