DeepRetro: Retrosynthetic Pathway Discovery using Iterative LLM Reasoning
Created by
Haebom
저자
Shreyas Vinaya Sathyanarayana, Rahil Shah, Sharanabasava D. Hiremath, Rishikesh Panda, Rahul Jana, Riya Singh, Rida Irfan, Ashwin Murali, Bharath Ramsundar
개요
본 논문은 복잡한 분자 합성에 필수적인 역합성(retrosynthesis) 문제를 해결하기 위해, 기존 템플릿 기반/몬테 카를로 트리 탐색 도구와 대규모 언어 모델(LLM)의 생성 능력을 통합한 오픈소스 기반의 반복적 하이브리드 역합성 프레임워크인 DeepRetro를 제시합니다. DeepRetro는 템플릿 기반 엔진으로 먼저 합성 계획을 시도하고, 실패 시 LLM이 단일 단계 역합성 분리를 제안합니다. 제안된 분리는 유효성, 안정성 및 환각 검사를 거친 후, 결과 전구체가 재귀적으로 파이프라인에 다시 입력되어 추가 평가를 받습니다. 이러한 반복적 개선을 통해 동적 경로 탐색 및 수정이 가능합니다. 벤치마크 평가와 사례 연구를 통해 복잡한 천연물 화합물에 대한 실행 가능하고 새로운 역합성 경로를 식별하는 능력을 보여주며, 특히 전문 화학자의 인간-루프 피드백을 허용하는 대화형 그래픽 사용자 인터페이스를 개발하여 LLM 추론의 잠재력을 입증합니다.
시사점, 한계점
•
시사점:
◦
LLM의 생성 능력과 기존 템플릿 기반 방법의 장점을 결합하여 역합성 문제 해결에 새로운 접근 방식을 제시.
◦
반복적이고 피드백 기반의 접근 방식을 통해 동적 경로 탐색 및 수정이 가능하며, 더욱 효과적인 다단계 계획 수립 가능성 제시.
◦
복잡한 천연물 화합물에 대한 새로운 합성 경로를 발견하는 잠재력을 보여줌.
◦
전문가의 인간-루프 피드백을 통합하여 알고리즘의 정확성과 효율성을 향상시킬 수 있음.
◦
오픈소스로 제공되어 접근성과 확장성이 높음.
•
한계점:
◦
LLM의 환각 문제 해결을 위한 검증 과정의 효율성 및 정확성에 대한 추가 연구 필요.
◦
다양한 화합물 및 복잡성에 대한 일반화 성능 평가 및 개선 필요.
◦
템플릿 기반 엔진과 LLM 간의 효율적인 상호작용 및 정보 전달 메커니즘에 대한 추가 연구 필요.
◦
대규모 데이터셋을 이용한 훈련 및 평가가 필요하며, 데이터의 질과 양에 따라 성능이 크게 영향을 받을 수 있음.