본 논문은 지식 그래프(KG)를 활용한 검색 증강 생성(RAG) 방법론의 성능을 다양한 응용 시나리오와 기술적 구성에 따라 체계적으로 분석하여 KG-RAG의 적용 시점과 방법에 대한 기반을 마련하고자 한다. KG-RAG 프레임워크의 마인드 맵을 제시하고 일반적인 파이프라인을 요약한 후, 6가지 KG-RAG 방법론을 9개의 다양한 도메인 및 시나리오의 데이터셋에 대해 재구현 및 평가하는 실험 연구를 수행한다. 여기에는 9가지 KG-RAG 구성과 17가지 대규모 언어 모델(LLM)의 조합, 그리고 메타인지와 KG-RAG의 결합을 시도하는 연구도 포함된다. 연구 결과는 KG-RAG 구성 요소의 적절한 적용 조건과 최적 구성의 중요성을 강조한다.
시사점, 한계점
•
시사점:
◦
다양한 응용 시나리오와 기술적 구성에 따른 KG-RAG 방법론의 성능 비교 분석을 통해 KG-RAG 적용의 최적 조건을 제시한다.
◦
KG-RAG 구성 요소의 최적 구성이 성능에 미치는 영향을 분석하여 효과적인 KG-RAG 시스템 구축에 대한 통찰력을 제공한다.
◦
메타인지와 KG-RAG의 결합을 시도하여 새로운 연구 방향을 제시한다.
•
한계점:
◦
본 연구는 제한된 수의 KG-RAG 방법론과 데이터셋에 대한 실험으로 일반화 가능성에 한계가 있을 수 있다.
◦
더욱 다양한 LLM과 KG-RAG 구성의 조합에 대한 연구가 필요하다.
◦
메타인지와 KG-RAG 결합에 대한 연구는 아직 초기 단계이며, 추가적인 연구가 필요하다.