DermaSynth는 피부과학 관련 임상 과제를 위한 92,020개의 합성 이미지-텍스트 쌍으로 구성된 데이터셋입니다. 기존의 오픈 액세스 피부과 이미지 저장소(DERM12345, BCN20000, PAD-UFES-20, SCIN, HIBA)를 기반으로 Gemini 2.0을 사용하여 임상 관련 프롬프트와 자가 지시 방법을 활용, 다양하고 풍부한 합성 텍스트를 생성했습니다. 메타데이터를 프롬프트에 통합하여 환각을 줄였으며, 5,000개의 샘플로 Llama-3.2-11B-Vision-Instruct 모델을 미세 조정하여 DermatoLlama 1.0을 개발했습니다. 피부과 AI 연구를 지원하고 가속화할 것으로 기대됩니다. 데이터와 코드는 GitHub에서 공개됩니다.