OpenTCM: A GraphRAG-Empowered LLM-based System for Traditional Chinese Medicine Knowledge Retrieval and Diagnosis
Created by
Haebom
저자
Jinglin He, Yunqi Guo, Lai Kwan Lam, Waikei Leung, Lixing He, Yuanan Jiang, Chi Chiu Wang, Guoliang Xing, Hongkai Chen
개요
본 논문은 전통 중의학(TCM)의 현대화와 접근성 향상을 위해 대규모 언어 모델(LLM) 기반 시스템인 OpenTCM을 개발한 연구 결과를 제시합니다. OpenTCM은 중의학 전문 지식 그래프와 그래프 기반 검색 증강 생성(GraphRAG)을 결합하여 고품질의 정보 검색 및 진단 질문 응답 기능을 제공합니다. 68권의 부인과 관련 고전 의학 서적에서 373만 개 이상의 고전 중국어 문자를 추출하고, 48,000개 이상의 엔티티와 152,000개 이상의 관계로 구성된 다중 관계 지식 그래프를 구축했습니다. DeepSeek 및 Kimi와 같은 중국어 중심의 LLM을 사용하여 높은 정확도의 의미 이해를 보장하였으며, 모델 미세 조정 없이 GraphRAG를 통해 고품질의 성분 정보 검색 및 진단 질문 응답이 가능하도록 했습니다. 실험 결과, OpenTCM은 성분 정보 검색에서 4.378, 진단 질문 응답에서 4.045의 평균 전문가 점수(MES)를 달성하여 기존 최첨단 솔루션을 능가하는 성능을 보였습니다.
시사점, 한계점
•
시사점:
◦
LLM과 지식 그래프를 결합하여 TCM 정보 검색 및 진단 지원 시스템 개발의 새로운 가능성 제시.
◦
고전 중국어 문헌 분석 및 TCM 개념 간의 복잡한 의미 관계 모델링에 대한 효과적인 해결책 제시.
◦
모델 미세 조정 없이 GraphRAG를 활용하여 높은 정확도와 효율성을 달성.
◦
실제 TCM 사용 사례에서 기존 최첨단 시스템보다 우수한 성능 입증.
•
한계점:
◦
사용된 데이터셋이 부인과 관련 서적에 국한되어, 다른 TCM 분야로의 일반화 가능성에 대한 추가 연구 필요.