본 논문은 질적 연구의 확장을 위해 개발된 AI 기반 시스템 Muse의 성능을 평가한다. 질적 연구는 텍스트 데이터와의 반복적인 상호작용을 통해 의미를 구성하는 데 중점을 두지만, 코더의 피로와 해석 편향 등의 문제로 인해 대규모 데이터셋 분석에 어려움이 있었다. Muse는 이러한 문제점을 해결하기 위해 개발되었으며, 연구자들은 Muse를 통해 주제를 식별하고 데이터셋에 주석을 달 수 있다. 본 연구에서는 Muse와 인간 간의 상호 평가자 신뢰도를 평가하고 오류 분석을 수행하여 Muse의 강점과 약점을 파악하고, 인간의 편향을 보정할 수 있는 능력을 확인했다.