정확한 의료 예측은 환자 결과 개선과 운영 비용 절감에 중요합니다. 대규모 언어 모델(LLM)은 풍부한 매개변수적 지식을 활용하여 의료 예측을 향상시킬 수 있는 유망한 길을 제시합니다. 하지만 LLM은 내장된 지식의 신뢰성과 범위의 한계로 인해 사실적 부정확성에 취약합니다. 외부 지식을 통합하여 이러한 문제를 완화하기 위해 GraphRAG 및 그 변형과 같은 검색 증강 생성(RAG) 프레임워크가 제안되었지만, 의료 환경에서 두 가지 주요 과제에 직면합니다. (1) 검색 메커니즘을 활성화할 임상적 필요성을 식별하는 것과, (2) 컨텍스트에 적절한 검색을 생성하기 위해 검색기와 생성기 간의 시너지를 달성하는 것입니다. 이러한 과제를 해결하기 위해, 본 논문은 의료 분야에서 검색 시점과 하위 모듈 간의 협업을 최적화하는 방법을 동시에 해결하는 생성적 계층적 에이전트 RAG 프레임워크(GHAR)를 제안합니다. 특히 첫 번째 과제의 경우, Agent-Top과 Agent-Low로 구성된 이중 에이전트 아키텍처를 설계합니다. Agent-Top은 주치의 역할을 하며 매개변수적 지식에 의존할지 또는 검색을 시작할지 반복적으로 결정하고, Agent-Low는 자문 서비스 역할을 하며 검색이 트리거되면 모든 작업 관련 지식을 요약합니다. 두 번째 과제를 해결하기 위해, 공식적인 마르코프 의사 결정 프로세스 내에서 두 에이전트의 최적화를 혁신적으로 통합하고, 정확한 예측이라는 공유 목표를 달성하면서 각자의 역할을 유지하도록 다양한 보상을 설계했습니다. 세 가지 인기 있는 작업에 대한 세 가지 벤치마크 데이터 세트에 대한 광범위한 실험을 통해 최첨단 기준선보다 우월함을 입증하여 계층적 에이전트 RAG가 의료 시스템을 발전시킬 가능성을 강조합니다.