Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Wearable intelligent throat enables natural speech in stroke patients with dysarthria

Created by
  • Haebom
Category
Empty

저자

Chenyu Tang, Shuo Gao, Cong Li, Wentian Yi, Yuxuan Jin, Xiaoxue Zhai, Sixuan Lei, Hongbei Meng, Zibo Zhang, Muzi Xu, Shengbo Wang, Xuhang Chen, Chenxi Wang, Hongyun Yang, Ningli Wang, Wenyu Wang, Jin Cao, Xiaodong Feng, Peter Smielewski, Yu Pan, Wenhui Song, Martin Birchall, Luigi G. Occhipinti

개요

AI 기반 지능형 인후 시스템(IT)을 이용한 침묵 발화 시스템이 제시되었다. 이 시스템은 인후 근육 진동과 경동맥 맥박 신호 센서를 대규모 언어 모델(LLM) 처리와 통합하여 유창하고 감정 표현이 풍부한 의사소통을 가능하게 한다. 초고감도 섬유 변형 센서를 사용하여 목 부위에서 고품질 신호를 포착하고 토큰 수준 처리를 지원하여 실시간 연속 음성 디코딩을 가능하게 하며, 지연 없는 원활한 의사소통을 제공한다. 실험 결과, 5명의 운동 실조증 환자를 대상으로 한 테스트에서 IT의 LLM 에이전트는 토큰 오류를 지능적으로 수정하고 문장 수준의 감정적 및 논리적 일관성을 향상시켜 낮은 오류율(단어 오류율 4.2%, 문장 오류율 2.9%)과 사용자 만족도 55% 증가를 달성했다. 이 연구는 운동 실조증 환자를 위한 휴대 가능하고 직관적인 의사소통 플랫폼을 구축하며, 다양한 신경 질환과 다국어 지원 시스템에 광범위하게 적용될 가능성을 제시한다.

시사점, 한계점

시사점:
운동 실조증 환자의 의사소통 개선에 대한 효과적인 AI 기반 솔루션 제시.
낮은 오류율과 높은 사용자 만족도를 달성하여 실용성 입증.
휴대성과 직관적인 인터페이스를 통해 사용 편의성 증대.
다양한 신경 질환 및 다국어 지원 가능성 제시.
한계점:
연구 참여자 수가 제한적(5명의 환자).
다양한 신경 질환 및 다국어 환경에서의 일반화 가능성에 대한 추가 연구 필요.
장기간 사용 시스템의 안정성 및 내구성에 대한 추가 연구 필요.
임상적 효능에 대한 추가적인 검증 필요.
👍