OpenTCM: A GraphRAG-Empowered LLM-based System for Traditional Chinese Medicine Knowledge Retrieval and Diagnosis
Created by
Haebom
저자
Jinglin He, Yunqi Guo, Lai Kwan Lam, Waikei Leung, Lixing He, Yuanan Jiang, Chi Chiu Wang, Guoliang Xing, Hongkai Chen
개요
본 논문은 전통 중의학(TCM)의 현대화 및 접근성 향상을 위해 대규모 언어 모델(LLM) 기반 시스템인 OpenTCM을 개발했습니다. OpenTCM은 중의학 전문 지식 그래프와 그래프 기반 검색 증강 생성(GraphRAG)을 결합합니다. 68권의 부인과 관련 중의학 고전 서적에서 373만 개 이상의 한자를 추출하고, 이를 바탕으로 48,000개 이상의 개체와 152,000개 이상의 관계로 구성된 다중 관계 지식 그래프를 구축했습니다. DeepSeek 및 Kimi와 같은 중국어 중심 LLM을 사용하여 높은 정확도의 의미 이해를 보장했습니다. OpenTCM은 모델 미세 조정 없이 고정확도의 성분 정보 검색 및 진단 질의응답을 가능하게 합니다. 실험 결과, 제안된 프롬프트 설계와 모델 선택은 지식 그래프의 품질을 크게 향상시켜 정밀도 98.55%, F1 점수 99.55%를 달성했습니다. 또한, 성분 정보 검색 및 진단 질의응답 과제에서 전문가 평균 점수가 각각 4.5와 3.8로 기존 최첨단 솔루션을 능가하는 실제 중의학 사용 사례에서 성능을 보였습니다.
시사점, 한계점
•
시사점:
◦
LLM 기반 시스템을 활용하여 전통 중의학 지식의 현대화 및 접근성 향상에 기여.
◦
중의학 고전 문헌 분석 및 지식 그래프 구축을 위한 효과적인 방법론 제시.
◦
고정확도의 성분 정보 검색 및 진단 질의응답 기능 제공.
◦
기존 최첨단 솔루션 대비 우수한 성능 입증.
•
한계점:
◦
현재는 부인과 관련 중의학 고전에 국한된 데이터 사용. 다른 분야의 중의학 지식 확장 필요.
◦
LLM의 성능에 의존적이므로, LLM의 한계가 OpenTCM의 성능에 영향을 미칠 수 있음.
◦
전문가 평가에 기반한 성능 평가는 주관성을 포함할 가능성이 있음. 객관적인 지표를 활용한 추가적인 평가 필요.
◦
사용된 LLM (DeepSeek, Kimi) 의 세부적인 설명 부족. 다른 LLM과의 비교 분석 필요.