본 논문은 의생명 QA 시스템을 위한 Retrieval-Augmented Generation (RAG) 시스템을 체계적으로 조사하여 검색 전략과 응답 시간의 상충관계를 평가한 연구이다. PubMed의 약 10% (240만 문서)를 대상으로 BM25, BioBERT, MedCPT 및 하이브리드 접근 방식을 포함한 최첨단 검색 방법과 Elasticsearch, MongoDB, FAISS와 같은 일반적인 데이터 저장소를 평가하여 색인 효율성, 검색 지연 시간 및 종단 간 RAG 시스템의 검색 성능을 측정하였다. 이러한 통찰력을 바탕으로 전체 2400만 PubMed 코퍼스에 최종 RAG 시스템을 배포하고, 서로 다른 검색기의 전반적인 성능에 대한 영향을 비교하였다. 검색 깊이 평가 결과, BM25로 50개의 문서를 검색한 후 MedCPT로 재순위 지정하는 것이 정확도(0.90), 재현율(0.90) 및 응답 시간(1.91초)의 균형을 최적으로 맞춘다는 것을 확인하였다. BM25 검색 시간은 안정적(82ms)이었으나 MedCPT가 주된 계산 비용을 차지하였다. 이 연구는 의생명 QA를 위한 검색 깊이, 효율성 및 확장성에서 이전에는 잘 알려지지 않았던 상충관계를 강조한다. 오픈 소스 코드를 통해 시스템은 완전히 재현 가능하고 확장 가능하다.