본 논문은 대규모 언어 모델(LLM) 기반 다중 에이전트 시스템(MAS)을 이용한 질적 연구의 가능성과 한계를 실험적으로 분석한 연구이다. 8개 코드로 구성된 코드북을 기반으로, 6개의 오픈소스 LLM(30억~320억 파라미터)과 18가지 실험 설정을 사용하여 온라인 수학 과외 세션의 기록에 대한 77,000개 이상의 코딩 결정을 분석하였다. 에이전트의 성격(중립, 단정적, 공감적)과 온도 매개변수가 합의 형성 및 코딩 정확도에 미치는 영향을 조사하였으며, 단일 에이전트와 MAS의 성능을 비교하였다.