본 논문은 의료 분야에서 대규모 언어 모델(LLM)의 활용을 제한하는 요소를 해결하기 위해, 의료 계산기와 같은 특수 도구를 통합하는 새로운 에이전트 아키텍처 MeNTi를 제안한다. MeNTi는 특화된 의료 도구 키트를 통합하고, 메타 도구 및 중첩 호출 메커니즘을 사용하여 LLM의 도구 활용 능력을 향상시킨다. 특히, 계산기 선택, 슬롯 채우기, 단위 변환 등 복잡한 의료 시나리오에서 발생하는 실질적인 문제를 해결하기 위해 유연한 도구 선택 및 중첩 도구 호출 기능을 제공한다. 또한, 의료 계산기를 사용하여 환자의 건강 상태를 평가하는 LLM의 능력을 평가하기 위한 새로운 벤치마크 CalcQA를 소개한다. CalcQA는 전문 의사가 구성한 100개의 케이스-계산기 쌍과 281개의 의료 도구 키트로 구성된다. 실험 결과는 MeNTi 프레임워크가 성능을 크게 향상시킨다는 것을 보여준다.