# Retrieval-Augmented LLMs for Evidence Localization in Clinical Trial Recruitment from Longitudinal EHR Narratives

### 저자

Ziyi Chen, Mengxian Lyu, Cheng Peng, Yonghui Wu

### 💡 개요

이 논문은 임상 시험 환자 모집 과정에서 발생하는 장기 의료 기록(EHR) 분석의 병목 현상을 해결하기 위해 검색 증강 생성(RAG)을 활용한 대규모 언어 모델(LLM)을 제안합니다. 긴 문서 처리 시 발생하는 "Lost in the Middle" 문제를 극복하기 위해 다양한 LLM 모델과 컨텍스트 확장 전략을 탐색했으며, 특히 MedGemma와 RAG 전략을 결합했을 때 89.05%의 높은 F1 점수를 달성하며 가장 우수한 성능을 보였습니다.

### 🔑 시사점 및 한계

- RAG 전략은 장기적인 추론이 필요한 복잡한 임상 시험 기준에서 LLM의 성능을 크게 향상시킬 수 있습니다.

- 일반 LLM 및 의료 특화 LLM 모두 긴 문서 처리에서 "Lost in the Middle" 문제를 겪을 수 있으며, 이를 해결하기 위한 효과적인 전략(예: NER 기반 요약, RAG)이 필요합니다.

- 실제 임상 시험 모집에서 LLM의 효율적인 도입을 위해서는 특정 기준에 따라 규칙 기반 쿼리, 인코더 기반 LLM, 생성 LLM 중 최적의 방법을 선택하고 컴퓨팅 비용을 고려해야 합니다.

- 비교적 짧은 컨텍스트(예: 실험실 검사 결과)를 요구하는 임상 시험 기준에서는 LLM 도입의 개선 효과가 제한적일 수 있습니다.

[PDF 보기](https://arxiv.org/pdf/2604.05190)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).