본 논문은 대규모 언어 모델(LLM)이 생성하는 정보의 사실성 검증에 있어 기존의 단일 사실성 레이블 부여 방식의 한계를 지적하고, 복잡한 주장을 하위 주장으로 분해하여 검증하는 세분화된 검증 방식을 제안합니다. 이를 위해 하위 주장 생성의 어려움을 고려하여, 하위 주장의 품질을 평가하는 지표와 자동 평가기를 포함한 세분화된 사실 검증을 위한 벤치마크 FactLens를 소개합니다. FactLens는 수동으로 정제된 고품질의 기준 데이터를 사용하며, 자동 평가기와 인간 판단 간의 일치성을 보여줍니다. 또한 하위 주장의 특징이 전반적인 검증 성능에 미치는 영향을 논의합니다.