본 논문은 의료 정보 검색(MIR)에서 효과적인 제로샷 밀집 검색을 달성하기 위한 새로운 접근 방식인 SL-HyDE(Self-Learning Hypothetical Document Embeddings)를 제시합니다. SL-HyDE는 대규모 언어 모델(LLM)을 활용하여 주어진 질의에 기반한 가상 문서를 생성하고, 이를 통해 밀집 검색기를 안내하여 가장 관련성 높은 문서를 식별합니다. 이 자기 학습 프레임워크는 라벨링되지 않은 의료 말뭉치를 활용하여 가상 문서 생성과 검색을 점진적으로 개선하며, 관련성 레이블 데이터가 필요하지 않습니다. 또한, 실제 의료 시나리오를 기반으로 한 포괄적인 평가 프레임워크인 중국어 의료 정보 검색 벤치마크(CMIRB)를 제시하며, 10개의 모델을 CMIRB에서 벤치마킹하여 의료 정보 검색 시스템 평가를 위한 엄격한 기준을 설정합니다. 실험 결과, SL-HyDE는 HyDE보다 검색 정확도가 훨씬 높고 다양한 LLM 및 검색기 구성에서 강력한 일반화 및 확장성을 보여줍니다. 코드와 데이터는 공개적으로 제공됩니다.