본 논문은 최신 대규모 언어 모델(LLMs)의 화학 분야 적용에 있어, 구식 사전 학습 지식과 전문적인 화학 지식 통합의 어려움이라는 한계를 극복하기 위한 새로운 접근 방식을 제시합니다. 기본 정보 검색부터 복잡한 반응 예측까지 다양한 137개의 외부 화학 도구를 통합하는 LLM 기반 에이전트와, 효과적인 도구 선택 및 미세 조정 및 평가 중 정확한 매개변수 채우기를 가능하게 하는 ChemToolBench 데이터셋 생성 파이프라인을 제안합니다. 계층적 진화적 몬테카를로 트리 탐색(HE-MCTS) 프레임워크를 통해 도구 계획 및 실행을 독립적으로 최적화하고, 자체 생성 데이터를 활용하여 정책 모델의 단계별 미세 조정(FT)과 GPT-4o를 능가하는 작업 적응형 PRM 및 ORM을 지원합니다. 실험 결과, 화학 QA 및 발견 작업에서 성능을 크게 향상시켜, 고급 화학 응용을 위한 전문 도구와 LLM의 강력한 통합 솔루션을 제공함을 보여줍니다. 모든 데이터셋과 코드는 https://github.com/AI4Chem/ChemistryAgent 에서 확인할 수 있습니다.