# MedAgent-Pro: Towards Multi-modal Evidence-based Medical Diagnosis via Reasoning Agentic Workflow

### 저자

Ziyue Wang, Junde Wu, Chang Han Low, Yueming Jin

### 개요

MedAgent-Pro는 다양한 의료 영상 분석을 통해 신뢰할 수 있고, 설명 가능하며, 정확한 의료 진단을 제공하는 증거 기반 추론 에이전트 시스템입니다.  기존의 다중 모달 대규모 언어 모델(MLLM)의 한계인 시각적 입력에 대한 정확한 이해 부족과 환각 및 추론의 불일관성 문제를 해결하기 위해, 질병 특징에 따른 신뢰할 수 있는 진단 계획을 생성하는 지식 기반 추론과 다양한 도구 에이전트를 활용한 다중 모달 입력 처리 및 정량적, 정성적 증거 기반 최종 진단을 위한 계층적 워크플로우를 제시합니다.  2D 및 3D 의료 진단 작업에 대한 포괄적인 실험을 통해 MedAgent-Pro의 우수성과 효과를 입증하고, 사례 연구를 통해 신뢰성과 해석 가능성을 강조합니다. 코드는 GitHub에서 공개됩니다.

### 시사점, 한계점

- **시사점:**

    - 다중 모달 의료 진단을 위한 신뢰할 수 있고, 설명 가능하며, 정확한 에이전트 시스템을 제시합니다.

    - MLLM의 한계점인 시각적 입력에 대한 제한된 이해와 추론의 불일관성 문제를 효과적으로 해결합니다.

    - 계층적 워크플로우를 통해 지식 기반 추론과 다중 모달 입력 처리를 통합합니다.

    - 2D 및 3D 의료 진단 작업에서 우수한 성능을 보여줍니다.

    - 코드 공개를 통해 연구의 재현성과 확장성을 높입니다.

- **한계점:**

    - 제한된 데이터셋에 대한 성능 평가 결과는 일반화 가능성에 대한 추가 연구가 필요합니다.

    - 실제 임상 환경에서의 성능 평가 및 검증이 필요합니다.

    - 다양한 질병 및 의료 영상 유형에 대한 적용 가능성을 추가적으로 검증해야 합니다.

[PDF 보기](https://arxiv.org/pdf/2503.18968)

![https://i.imgur.com/ZPTNKyd.jpeg](https://i.imgur.com/ZPTNKyd.jpeg)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).
