본 논문은 NLPCC 2025에서 새롭게 제시된 M4IVQA 챌린지에 대한 소개이다. M4IVQA는 의료 교육 비디오를 중심으로 다중 모달, 다국어, 다단계 추론을 필요로 하는 의료 지시 질문 응답 시스템 연구를 발전시키기 위한 과제이다. 세 가지 트랙 (M4TAGSV, M4VCR, M4TAGVC)으로 구성되며, 참가자들은 비디오 및 텍스트 데이터 처리, 다국어 질의 이해, 다단계 의료 질문에 대한 관련 답변 제공이 가능한 알고리즘을 개발해야 한다. 이 챌린지는 의료 분야의 다중 모달 추론 시스템 혁신을 주도하여 스마트 응급 대응 시스템 및 효과적인 다국어 의료 교육 플랫폼 구축에 기여할 것으로 기대된다.