QoQ-Med-7B/32B는 의료 영상, 시계열 신호, 텍스트 보고서를 함께 처리하는 최초의 공개된 일반적인 임상 기반 모델이다. Domain-aware Relative Policy Optimization (DRPO)를 사용하여 2.61백만 개의 instruction tuning 쌍으로 훈련되었으며, 다양한 임상 도메인에서 진단 성능을 향상시킨다. 또한, 세분화된 데이터로 훈련되어 진단과 관련된 중요한 영역을 강조 표시하며, 오픈 모델보다 10배 높은 IoU를 달성한다. 모델 가중치, 모듈식 훈련 파이프라인, 추론 과정 등을 공개하여 재현성과 후속 연구를 지원한다.