Citrus-V는 의료 영상 분석과 텍스트 추론을 결합한 다중 모달 의료 기반 모델입니다. 탐지, 분할, 다중 모달 사고 연쇄 추론을 통합하여 픽셀 단위 병변 위치 확인, 구조화된 보고서 생성, 의사 수준의 진단 추론을 단일 프레임워크에서 가능하게 합니다. 새로운 다중 모달 학습 방식을 제안하며, 추론, 탐지, 분할, 문서 이해 작업을 다루는 큐레이션된 오픈소스 데이터 세트를 공개합니다. 여러 벤치마크에서 기존 오픈소스 의료 모델 및 전문가 수준의 영상 시스템을 능가하는 성능을 보이며, 시각적 근거에서 임상적 추론까지 통합된 파이프라인을 제공하고 정확한 병변 정량화, 자동 보고 및 신뢰할 수 있는 두 번째 의견을 지원합니다.