GraphMERT는 비정형 텍스트 코퍼스에서 고품질 지식 그래프(KG)를 추출하는 소형 그래프 인코더 전용 모델입니다. GraphMERT는 추상화 학습을 위한 신경망과 검증 가능한 추론을 위한 기호적 KG로 구성된 모듈식 신경 기호 스택을 형성합니다. 이 모델은 벤치마크 정확도에서 최고 성능을 달성하는 동시에, 기존 모델보다 우수한 기호적 표현을 제공하며, 특히 도메인별 지식 그래프의 신뢰성을 목표로 합니다. 예를 들어, 당뇨병 관련 PubMed 논문에서 80M 파라미터 GraphMERT는 69.8%의 FActScore를, 32B 파라미터 기반 LLM은 40.2%의 FActScore를 기록했습니다. GraphMERT KG는 또한 68.8%의 ValidityScore를 달성하여, LLM의 43.0%보다 높습니다.