본 논문에서는 정보 검색 시스템에서 얻어지는 대부분의 비정형 데이터를 구조화된 지식 그래프(KG)로 변환하는 과정에서 발생하는 어려움을 해결하기 위해 GraphJudger라는 새로운 프레임워크를 제안합니다. 기존 방법의 세 가지 한계점, 즉 1) 실제 문서의 정보 과다 및 노이즈 문제, 2) 특정 도메인 문서에서의 정확한 지식 추출 어려움, 3) LLM을 이용한 비지도 학습에서 발생하는 환각 현상을 해결하기 위해, 개체 중심 반복적 텍스트 잡음 제거, 지식 인식 명령어 미세 조정, 그래프 판단 등 세 가지 혁신적인 모듈을 도입했습니다. 두 개의 일반 텍스트-그래프 쌍 데이터셋과 한 개의 도메인 특정 텍스트-그래프 쌍 데이터셋에 대한 실험 결과, 제안된 방법이 기존 방법보다 우수한 성능을 보임을 확인했습니다. 소스 코드는 Github에서 공개됩니다.