본 논문은 산호초 보존을 위한 효율적인 모니터링을 위해 시각적 질의응답(VQA) 시스템을 산호초 이미지에 적용하는 것을 목표로 한다. 기존 VQA 시스템의 한계를 극복하고 산호초 분석에 특화된 대규모 VQA 데이터셋인 CoralVQA를 제시한다. CoralVQA는 3개 대양에서 수집된 67개 산호 속에 해당하는 12,805개의 실제 산호 이미지와, 생태 및 건강 상태를 종합적으로 평가하는 277,653개의 질문-답변 쌍으로 구성된다. 해양 생물학자와의 협력을 통해 반자동 데이터 구축 파이프라인을 개발하여 확장성과 전문적인 데이터 품질을 보장하였다. 최첨단 LVLMs을 평가하여 VQA 시스템의 한계와 가능성을 제시하고, 향후 산호 보존 노력을 지원하는 LVLM 개발의 기반을 마련한다.