MedKGent: A Large Language Model Agent Framework for Constructing Temporally Evolving Medical Knowledge Graph
Created by
Haebom
저자
Duzhen Zhang, Zixiao Wang, Zhong-Zhi Li, Yahan Yu, Shuncheng Jia, Jiahua Dong, Haotian Xu, Xing Wu, Yingying Zhang, Tielin Zhang, Jie Yang, Xiuying Chen, Le Song
개요
본 논문은 의학 문헌의 급증에 따라 지식 그래프(KG)를 효율적으로 구축하는 방법으로 MedKGent라는 LLM 에이전트 프레임워크를 제시합니다. 1975년부터 2023년까지 발표된 1천만 개 이상의 PubMed 초록을 사용하여, 매일의 시간대별로 의학 지식의 생성 과정을 시뮬레이션합니다. Qwen2.5-32B-Instruct 모델을 기반으로 하는 두 가지 전문 에이전트(추출 에이전트와 구성 에이전트)를 활용하여 KG를 증분적으로 구축합니다. 추출 에이전트는 지식 트리플을 식별하고 신뢰도 점수를 할당하며, 구성 에이전트는 신뢰도 점수와 타임스탬프를 사용하여 트리플을 통합하고 충돌을 해결합니다. 최종적으로 생성된 KG는 156,275개의 엔티티와 2,971,384개의 관계형 트리플을 포함하며, 정확도는 약 90%에 달합니다. 7개의 의학 질문 응답 벤치마크를 사용한 실험 결과, 기존 방법보다 성능이 향상되었음을 보여주며, 약물 재창출과 같은 다양한 응용 분야에서 활용 가능성을 제시합니다.
시사점, 한계점
•
시사점:
◦
LLM 에이전트 기반의 시간적 진화를 고려한 의학 지식 그래프 구축 방법 제시.
◦
기존 방법보다 높은 정확도(약 90%)를 달성.
◦
의학 질문 응답 및 약물 재창출 등 다양한 응용 분야에서 성능 향상 확인.
◦
신뢰도 점수를 활용한 지식 추출 및 통합으로 KG의 품질 향상.
•
한계점:
◦
Qwen2.5-32B-Instruct 모델에 의존적인 부분 존재. 다른 LLM 모델에 대한 일반화 가능성 검증 필요.