본 논문은 건강 관련 허위 정보의 식별 문제를 해결하기 위해, 대규모 언어 모델(LLM)이 그릇된 주장을 인식하는 능력을 향상시키는 데 초점을 맞추고 있다. 이를 위해, retrieval-augmented generation (RAG)을 사용하여 합성 허위 정보를 생성하는 MisSynth 파이프라인을 제안하고, 이를 통해 생성된 데이터를 사용하여 LLM을 미세 조정하는 방식을 연구했다. 연구 결과, 미세 조정된 모델이 바닐라 모델에 비해 상당한 정확도 향상을 보였으며, 특히 LLaMA 3.1 8B 모델의 경우 MISSCI 테스트 분할에서 F1 점수가 35% 이상 향상되었다. 본 연구는 제한된 자원 하에서도 합성 데이터가 실제 과학적 허위 정보 분류 작업에서 LLM의 성능을 크게 향상시킬 수 있음을 보여준다.