Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Can LLMs be Good Graph Judger for Knowledge Graph Construction?

Created by
  • Haebom
Category
Empty

저자

Haoyu Huang, Chong Chen, Conghui He, Yang Li, Jiawei Jiang, Wentao Zhang

개요

본 논문에서는 정보 검색 시스템에서 얻어지는 대부분의 비정형 데이터를 구조화된 지식 그래프(KG)로 변환하는 과정에서 발생하는 어려움을 해결하기 위해 GraphJudger라는 새로운 프레임워크를 제안합니다. 기존 방법의 세 가지 한계점, 즉 1) 실제 문서의 정보 과다 및 노이즈 문제, 2) 특정 도메인 문서에서의 정확한 지식 추출 어려움, 3) LLM을 이용한 비지도 학습에서 발생하는 환각 현상을 해결하기 위해, 개체 중심 반복적 텍스트 잡음 제거, 지식 인식 명령어 미세 조정, 그래프 판단 등 세 가지 혁신적인 모듈을 도입했습니다. 두 개의 일반 텍스트-그래프 쌍 데이터셋과 한 개의 도메인 특정 텍스트-그래프 쌍 데이터셋에 대한 실험 결과, 제안된 방법이 기존 방법보다 우수한 성능을 보임을 확인했습니다. 소스 코드는 Github에서 공개됩니다.

시사점, 한계점

시사점:
LLM을 단순 예측기가 아닌 그래프 판단자로 활용하는 새로운 접근 방식 제시.
실제 문서의 노이즈 및 도메인 특이성 문제를 효과적으로 해결하는 새로운 방법 제시.
기존 KG 생성 방법보다 우수한 성능을 보이는 GraphJudger 프레임워크 제시.
개방형 소스 코드 공개를 통한 연구의 재현성 및 확장성 확보.
한계점:
제안된 방법의 성능 평가가 특정 데이터셋에 국한될 수 있음.
다양한 도메인 및 데이터셋에 대한 추가적인 실험이 필요.
LLM의 환각 현상을 완전히 해결했다고 단정하기 어려움.
실제 환경 적용 시 발생할 수 있는 추가적인 문제점에 대한 검토 필요.
👍