본 논문은 대규모 언어 모델과 다중 모드 모델을 활용하여 텍스트 설명으로부터 새로운 분자를 생성하는 경량 어댑터 기반 전략인 Chemical Language Model Linker (ChemLML)를 제안합니다. 기존의 고품질 사전 훈련된 모델을 활용하여 텍스트와 분자를 결합하는 다중 모드 모델을 효율적으로 학습시키는 방법을 제시합니다. ChemLML은 다양한 사전 훈련된 텍스트 모델을 분자 생성에 맞춤화할 수 있으며, SMILES와 SELFIES라는 두 가지 분자 표현 방식 중 SMILES가 유효하지 않은 분자를 생성할 가능성이 있음에도 불구하고 성능이 더 우수함을 보여줍니다. 또한, PubChem 데이터셋의 문제점을 지적하고 필터링된 버전의 데이터셋을 제공하며, 단백질 억제제 및 막 투과성 분자 생성을 통해 ChemLML의 실용성을 입증합니다.