OpenTCM: A GraphRAG-Empowered LLM-based System for Traditional Chinese Medicine Knowledge Retrieval and Diagnosis
Created by
Haebom
저자
Jinglin He, Yunqi Guo, Lai Kwan Lam, Waikei Leung, Lixing He, Yuanan Jiang, Chi Chiu Wang, Guoliang Xing, Hongkai Chen
개요
본 논문은 전통 중의학(TCM)의 현대화 및 접근성 향상을 위해 대규모 언어 모델(LLM) 기반 시스템인 OpenTCM을 개발한 연구에 대한 것이다. OpenTCM은 중의학 전문 지식 그래프와 그래프 기반 검색 증강 생성(GraphRAG)을 결합하여 고품질의 정보 검색 및 진단 질의응답을 제공한다. 68권의 부인과 관련 고전 의서에서 373만 개 이상의 한자를 추출하고, 48,000개 이상의 개체와 152,000개 이상의 관계로 구성된 다중 관계 지식 그래프를 구축하였다. DeepSeek 및 Kimi와 같은 중국어 중심의 LLM을 사용하여 높은 정확도의 의미 이해를 보장하였으며, 모델 미세 조정 없이 성분 정보 검색 및 진단 질문 응답을 가능하게 한다. 실험 결과, OpenTCM은 성분 정보 검색에서 4.378, 진단 질문 응답에서 4.045의 평균 전문가 점수(MES)를 달성하여 기존 최고 성능을 능가하는 것으로 나타났다.
시사점, 한계점
•
시사점:
◦
LLM과 지식 그래프를 결합하여 TCM 정보 접근성과 활용성을 높였다.
◦
고전 한문 해석의 어려움을 극복하고 TCM의 복잡한 의미 관계를 모델링하는 새로운 방법을 제시하였다.
◦
모델 미세 조정 없이 높은 성능을 달성하여 실용성을 높였다.
◦
실제 TCM 사용 사례에서 기존 기술보다 우수한 성능을 입증하였다.
•
한계점:
◦
현재는 부인과 분야의 고전 의서에 국한되어 있으며, 다른 TCM 분야로의 확장성에 대한 추가 연구가 필요하다.