Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Your voice is your voice: Supporting Self-expression through Speech Generation and LLMs in Augmented and Alternative Communication

Created by
  • Haebom
Category
Empty

저자

Yiwen Xu, Monideep Chakraborti, Tianyi Zhang, Katelyn Eng, Aanchan Mohan, Mirjana Prpa

개요

본 논문은 다양한 모달 입력(텍스트, 음성, 상황적 단서 포함)과 대규모 언어 모델(LLM)을 통합하여 사용자의 표현력을 지원하는 증강 및 대체 의사소통(AAC) 시스템인 Speak Ease를 제시합니다. Speak Ease는 자동 음성 인식(ASR), 상황 인식 LLM 기반 출력 및 개인화된 텍스트 음성 변환 기술을 결합하여 더욱 개인화되고 자연스러우며 표현력 있는 의사소통을 가능하게 합니다. 음성 언어 치료사(SLP)를 대상으로 한 탐색적 타당성 연구 및 포커스 그룹 평가를 통해 AAC에서 표현력을 향상시키는 Speak Ease의 잠재력을 평가했습니다. 연구 결과는 AAC 사용자의 우선순위와 요구 사항, 그리고 더욱 개인화되고 상황에 맞는 의사소통을 지원함으로써 사용자의 표현력을 향상시키는 시스템의 능력을 보여줍니다. 이 연구는 AAC 시스템을 개선하고 표현력을 지원하기 위해 다중 모달 입력과 LLM 기반 기능을 사용하는 데 대한 통찰력을 제공합니다.

시사점, 한계점

시사점:
다중 모달 입력(텍스트, 음성, 상황적 단서)과 LLM을 통합한 AAC 시스템의 효용성을 보여줌.
개인화되고 상황에 맞는 의사소통을 지원하여 AAC 사용자의 표현력 향상 가능성 제시.
AAC 시스템 개발에 있어 LLM 기반 기능 활용의 중요성 강조.
AAC 사용자의 우선순위와 요구사항에 대한 심층적인 이해 제공.
한계점:
탐색적 연구 및 포커스 그룹 평가라는 제한된 연구 설계.
실제 AAC 사용자를 대상으로 한 장기간의 평가가 부족.
시스템의 확장성 및 일반화 가능성에 대한 추가 연구 필요.
LLM의 편향성 및 윤리적 문제에 대한 고려 부족.
👍