본 논문은 치매 환자의 비정상적인 발화 패턴으로 인해 기존 Whisper 모델이 치매 환자의 음성을 정확하게 전사하지 못하는 문제를 해결하기 위해, DementiaBank 및 자체 데이터셋을 활용하여 Whisper 모델을 미세 조정했습니다. 미세 조정 과정에서 채움말(filler words)을 포함하여 채움말 포함율(FIR)과 F1 점수를 측정하였고, 그 결과 미세 조정된 모델이 기존 모델보다 월등히 높은 성능을 보였습니다. 특히 중간 크기 모델은 0.24의 WER(단어 오류율)을 달성하여 기존 연구보다 성능이 향상되었고, 새로운 데이터 및 발화 패턴에 대한 일반화 성능도 향상됨을 보였습니다.