Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Development and Evaluation of HopeBot: an LLM-based chatbot for structured and interactive PHQ-9 depression screening

Created by
  • Haebom

저자

Zhijun Guo, Alvina Lai, Julia Ive, Alexandru Petcu, Yutong Wang, Luyuan Qi, Johan H Thygesen, Kezhi Li

개요

HopeBot이라는 대규모 언어 모델(LLM) 기반 챗봇을 개발하여 PHQ-9 설문지를 활용한 우울증 선별 검사를 수행하였습니다. 영국과 중국 성인 132명을 대상으로 자가 설문 방식과 챗봇 방식 모두를 이용한 연구를 진행했습니다. 그 결과, 두 방식 간 점수의 일치도가 높게 나타났으며(ICC = 0.91; 45% 동일), 참여자의 71%가 챗봇에 대한 신뢰도가 더 높다고 평가했습니다. 챗봇의 편의성, 음성 명료성, 민감한 주제 다루는 방식, 권고의 유용성에 대한 평균 평점은 각각 8.4, 7.7, 7.6, 7.4로 높게 나타났습니다. 또한, 참여자의 87.1%가 HopeBot을 재사용하거나 추천할 의향이 있다고 답했습니다. 이는 음성 기반 LLM 챗봇이 우울증 선별 검사의 확장 가능하고 부담이 적은 보조 도구로 활용될 수 있음을 시사합니다.

시사점, 한계점

시사점:
음성 기반 LLM 챗봇을 활용한 우울증 선별 검사의 효용성을 보여줌.
기존 정적 도구(PHQ-9)의 한계를 극복하고 상호작용성과 적응성을 높임.
챗봇에 대한 높은 신뢰도와 사용 만족도를 확인.
확장성이 높고 부담이 적은 우울증 선별 검사 도구로 활용 가능성 제시.
한계점:
연구 참여자 수가 상대적으로 적음 (132명).
특정 국가 (영국, 중국) 성인에 국한된 연구 결과.
권고의 유용성에 대한 평가에서 고용 상태 및 정신 건강 서비스 이용 경험에 따른 유의미한 차이 발견 (p < 0.05) - 이에 대한 추가 연구 필요.
챗봇의 장기간 사용 효과 및 안정성에 대한 추가 연구 필요.
👍