본 논문은 농업 전문가의 의사결정 향상을 위한 다중 모달 대화형 AI의 잠재력을 탐구하며, 특히 작물 질병 진단에 초점을 맞추고 있습니다. 기존의 텍스트 기반 상호작용 중심 연구에서 벗어나, 다양한 이미지-텍스트 데이터를 활용하는 다중 모달 대화형 AI의 발전에 주목합니다. 이를 위해 13만 7천 개의 작물 질병 이미지와 1백만 개의 질의응답 쌍으로 구성된 CDDM(crop disease domain multimodal) 데이터셋을 제시합니다. CDDM 데이터셋은 질병 식별부터 관리 방법까지 광범위한 농업 지식을 포함하며, 시각 및 텍스트 데이터 통합을 통해 정확하고 유용한 조언을 제공하는 질의응답 시스템 개발을 촉진합니다. 또한, 최첨단 다중 모달 모델을 미세 조정하여 작물 질병 진단의 성능 향상을 보여주며, LoRA(low-rank adaptation)를 활용한 새로운 미세 조정 전략을 제시합니다. 결론적으로, 본 논문은 CDDM 데이터셋, 미세 조정 전략, 벤치마크를 제공하여 첨단 AI 기술과 실용적인 농업 응용 간의 격차를 해소하고자 합니다.