본 논문은 의료 분야에서 대규모 언어 모델(LLM)의 채택이 사실 정확성과 고가의 독점 모델에 대한 우려로 제한되는 현실을 다룹니다. 연구진은 최적화된 맥락 검색을 통해 오픈소스 LLM을 이용한 비용 효율적이고 고성능 의료 AI를 구현함으로써 의료 질문 응답에 대한 비용-정확도 파레토 최적점을 크게 개선했습니다. 이는 오픈 모델이 독점 시스템에 필적하는 성능을 훨씬 저렴한 비용으로 달성할 수 있음을 보여줍니다. 주요 기여는 다지선다 형식의 한계를 극복하는 새로운 벤치마크인 OpenMedQA를 제시한 것입니다. 다지선다 형식은 오픈 엔드 설정에서 성능 저하를 초래하고 임상적 현실성이 부족한 경우가 많다는 것을 보여줍니다. 추가 기여로는 최적화된 맥락 검색 구현을 위한 실용적인 지침, 개선된 파레토 최적점을 통한 비용 효율성 향상에 대한 실증적 검증, 오픈 엔드 의료 QA에 대한 엄격한 평가를 위한 OpenMedQA 도입, 그리고 비용 효율적인 의료 AI를 위한 커뮤니티 리소스로 prompt_engine과 CoT/ToT/Thinking 데이터베이스를 공개한 점 등이 있습니다. 최적화된 검색과 오픈 엔드 QA 벤치마킹을 발전시킴으로써, 본 연구는 더욱 접근 가능하고 영향력 있는 LLM 기반 의료 솔루션을 위한 길을 열었습니다. 모든 자료는 공개되었습니다.