본 논문은 과학적 주장 검증을 위해 뒷받침 및 반박하는 문서를 증거로 식별하도록 설계된 RAG(Retrieval-Augmented Generation) 프레임워크의 확장판인 CIBER(Claim Investigation Based on Evidence Retrieval)를 소개합니다. CIBER는 다양한 질문 조사를 통해 응답 일관성을 평가함으로써 대규모 언어 모델(LLM)의 고유한 불확실성을 해결합니다. 내부 정보에 접근할 필요 없이 LLM의 행동 분석에 초점을 맞춤으로써, CIBER는 화이트박스 및 블랙박스 모델 모두에 적용 가능합니다. 또한, CIBER는 비지도 학습 방식으로 작동하여 다양한 과학 분야에 쉽게 일반화할 수 있습니다. 다양한 언어 능력을 가진 LLM을 사용하여 수행된 포괄적인 평가는 기존 RAG 접근 방식에 비해 CIBER의 우수한 성능을 보여줍니다. 이러한 결과는 CIBER의 효과를 강조할 뿐만 아니라 LLM 기반 과학적 주장 검증의 미래 발전을 위한 귀중한 통찰력을 제공합니다.