본 논문은 약물 발견 과정에서 대규모 언어 모델(LLM)의 활용을 가속화하는 데 초점을 맞추고 있습니다. 기존의 LLM 접근 방식은 도메인 특화된 미세 조정이 필요하여 유연성이 떨어지고, 방대한 과학 데이터의 통합을 어렵게 만드는 한계점을 지닙니다. 이를 해결하기 위해, 본 논문은 CLADD라는 새로운 시스템을 제안합니다. CLADD는 검색 증강 생성(RAG) 기반의 에이전트 시스템으로, 여러 LLM 에이전트의 협업을 통해 생물 의학 지식 기반에서 정보를 동적으로 검색하고, 질의 분자의 맥락을 파악하여 관련 증거를 통합하여 응답을 생성합니다. 도메인 특화된 미세 조정 없이도 데이터의 이질성, 모호성, 다중 소스 통합과 같은 RAG 워크플로우 적용의 주요 어려움을 해결하며, 다양한 약물 발견 과제에서 일반 목적 LLM, 도메인 특화 LLM 및 기존 딥러닝 접근 방식을 능가하는 성능을 보여줍니다.