본 논문은 화학 분자 구조를 효과적으로 표현하는 새로운 방법을 제시합니다. 기존의 SMILES 표현 방식의 한계를 극복하기 위해, 분자를 하위 구조로 분해하고 각 조각에 대한 descriptor-based 표현을 계산합니다. 이렇게 얻은 하위 구조 및 descriptor 데이터를 언어 모델(RoBERTa 사용)과 그래프 기반 모델(GIN, GCN, Graphormer 사용)에 입력으로 사용합니다. 특히, 언어 모델과 그래프 기반 모델을 통합한 이중 모드 아키텍처를 제안하며, Quantitative Structure-Activity Relationship (QSAR) 예측 등 다양한 작업에서 기존 방법보다 향상된 성능을 보여줍니다.