본 논문은 의학 분야의 체계적 문헌 고찰 자동화를 위한 새로운 접근법을 제시합니다. 기존의 문헌 고찰 자동화는 주로 텍스트 추론에 기반하여 단순한 단서를 통해 결론을 도출하는 한계를 가지고 있었습니다. 본 연구는 수치적 추론에 초점을 맞춰, 구조화된 수치적 증거(예: 사건 수, 표준 편차)를 추출하고, 전문가의 지식을 활용한 논리를 적용하여 결과 특정 결론을 도출하는 시스템을 개발했습니다. 수치 데이터 추출 모델은 지도 학습 미세 조정(SFT)과 새로운 가치 보상 모델을 사용한 강화 학습(RL)을 통해 학습되었으며, CochraneForest 벤치마크를 통해 기존 시스템 대비 성능 향상을 검증했습니다.