Assay2Mol은 생화학적 스크리닝 분석의 비정형 텍스트 데이터를 활용하여 새로운 약물 발견을 위한 후보 분자를 생성하는 대규모 언어 모델 기반 워크플로우입니다. 기존의 표적 단백질 구조를 기반으로 하는 머신러닝 접근 방식보다 성능이 우수하며, 합성 가능한 분자 생성을 향상시킵니다. 유사한 표적을 포함하는 기존 분석 기록을 검색하고, 검색된 분석 스크리닝 데이터를 사용하여 문맥 내 학습을 통해 후보 분자를 생성합니다. 방대한 양의 정량적 데이터와 함께 기술적 텍스트를 포함하는 과학 데이터베이스를 활용하여 초기 단계 약물 발견을 지원합니다.