본 논문은 대규모 언어 모델(LLM) 기반의 대화형 전화 설문 조사 프레임워크를 제안합니다. 기존 전화 설문 조사의 비용 및 노력 문제를 해결하기 위해, 연구자는 설문지를 디자인하고 참여자를 모집하고, LLM 기반의 전화 에이전트는 설문 조사를 실시하며, GPT-4o는 대화 내용을 분석하고, 데이터베이스는 결과를 저장하는 역할을 합니다. 8명의 참가자(영어 원어민 5명, 비원어민 3명)를 대상으로 40개의 설문 조사를 실시하여, LLM이 생성한 대화 내용의 정확성, GPT-4o에 의한 설문 응답의 정확성, 그리고 참가자의 전반적인 경험을 평가했습니다. GPT-4o는 7.7%의 단어 오류율에도 불구하고 98%의 평균 정확도로 설문 응답을 추출했습니다. 참가자들은 LLM 에이전트의 가끔 발생하는 오류에도 불구하고, 설문 조사의 목적을 효과적으로 전달하고, 이해도가 높으며, 참여도 높은 상호 작용을 유지했다고 평가했습니다. 결론적으로, 이 연구는 의료 분야에서 LLM 에이전트가 전화 설문 조사를 실시하고 분석하는 잠재력을 보여줍니다.