본 논문은 분자 언어 모델링에서 SMILES 서열과 그래프 데이터를 통합하는 새로운 다중 모달 프레임워크인 GraphT5를 제안합니다. 기존 방법들이 SMILES 서열에 의존하는 한계를 극복하기 위해, 1D SMILES 텍스트와 2D 그래프 표현을 통합하고, 새로운 cross-token attention 모듈을 통해 두 모달리티 간의 정보를 효과적으로 연결합니다. 분자 캡셔닝 및 IUPAC 명칭 예측 실험을 통해 GraphT5가 기존 방법보다 우수한 성능을 보임을 확인하였습니다. 이는 SMILES 텍스트와 그래프 데이터의 장점을 모두 활용하여 분자 언어 모델링의 성능을 향상시킬 수 있음을 보여줍니다.