ChemDFM-R: An Chemical Reasoner LLM Enhanced with Atomized Chemical Knowledge
Created by
Haebom
저자
Zihan Zhao, Bo Chen, Ziping Wan, Lu Chen, Xuanze Lin, Shiyang Yu, Situo Zhang, Da Ma, Zichen Zhu, Danyang Zhang, Huayang Wang, Zhongyang Dai, Liyang Wen, Xin Chen, Kai Yu
개요
본 논문은 화학 분야에서의 대규모 언어 모델(LLM)의 한계를 극복하기 위해 화학 추론 LLM인 ChemDFM-R을 개발한 연구에 관한 것이다. ChemDFM-R은 원자화된 화학 지식 데이터셋을 활용하여 기본 원리와 논리 구조에 대한 이해도를 높이고, 전문가 지식과 일반 영역 추론 능력을 통합하는 혼합 소스 증류 전략과 특정 영역 강화 학습을 통해 화학적 추론 능력을 향상시켰다. 다양한 화학 벤치마크 실험 결과, ChemDFM-R은 최첨단 성능을 달성하며 해석 가능하고 근거 기반의 출력을 제공함을 보여준다. 실제 인간-AI 협업 시나리오에서 명시적인 추론 과정이 모델의 신뢰성, 투명성, 실용성을 향상시키는 것을 추가적인 사례 연구를 통해 보여준다.