MentalChat16K: A Benchmark Dataset for Conversational Mental Health Assistance
Created by
Haebom
Category
Empty
저자
Jia Xu, Tianyi Wei, Bojian Hou, Patryk Orzechowski, Shu Yang, Ruochen Jin, Rachael Paulbeck, Joost Wagenaar, George Demiris, Li Shen
개요
MentalChat16K는 합성 정신 건강 상담 데이터셋과 완화 의료 또는 호스피스 치료 환자의 행동 건강 코치와 보호자 간의 익명화된 대화 기록 데이터셋을 결합한 영어 벤치마크 데이터셋입니다. 우울증, 불안, 슬픔 등 다양한 질환을 다루며, 대화형 정신 건강 지원을 위한 대규모 언어 모델의 개발 및 평가를 용이하게 하도록 설계되었습니다. 이 데이터셋은 환자의 프라이버시, 윤리적 고려 사항 및 책임감 있는 데이터 사용을 우선시하며, 정신 건강 지원 서비스 접근성 향상을 위한 공감적이고 개인화된 AI 솔루션에 대한 연구 발전을 목표로 합니다.
시사점, 한계점
•
시사점:
◦
대화형 정신 건강 지원을 위한 대규모 언어 모델 개발 및 평가에 활용 가능한 고품질 데이터셋 제공
◦
다양한 정신 건강 질환을 다루는 광범위한 데이터 포함
◦
환자 프라이버시 및 윤리적 고려사항 준수
◦
정신 건강 지원 서비스 접근성 향상에 기여 가능한 AI 기술 혁신 촉진
•
한계점:
◦
데이터셋의 크기(16K)가 다른 대규모 언어 모델 학습에 충분한지에 대한 검토 필요
◦
합성 데이터와 실제 데이터의 혼합으로 인한 데이터 편향 가능성 존재
◦
영어 데이터셋으로 언어적 제약 존재
◦
완화 의료 또는 호스피스 케어 환자에 집중되어 있어, 다른 정신 건강 문제의 다양성을 충분히 반영하지 못할 가능성 존재