Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Explainable Parkinsons Disease Gait Recognition Using Multimodal RGB-D Fusion and Large Language Models

Created by
  • Haebom
Category
Empty

저자

Manar Alnaasan, Md Selim Sarowar, Sungho Kim

개요

본 논문은 파킨슨병 조기 진단을 위해 현실적인 환경에서 RGB-D 데이터를 통합하여 파킨슨병 환자의 보행 패턴을 인식하는 설명 가능한 다중 모달 프레임워크를 제시한다. 듀얼 YOLOv11 기반 인코더, Multi-Scale Local-Global Extraction (MLGE) 모듈 및 Cross-Spatial Neck Fusion 메커니즘을 사용하여 시공간 표현을 향상시킨다. 또한, 고정된 대규모 언어 모델(LLM)을 통합하여 임상적으로 의미 있는 텍스트 설명을 생성한다. RGB-D 융합 프레임워크는 단일 입력 기반선보다 높은 인식 정확도, 환경 변화에 대한 향상된 견고성, 명확한 시각-언어 추론을 달성한다.

시사점, 한계점

시사점:
다중 모달 (RGB-D) 데이터 융합을 통한 파킨슨병 보행 분석 정확도 및 견고성 향상.
LLM을 활용한 시각적 정보와 임상적 이해의 연결을 통한 설명 가능한 결과 제공.
저조도 또는 의복으로 인한 폐색과 같은 현실적인 환경에서의 성능 개선.
한계점:
해당 논문의 구체적인 한계점에 대한 정보는 제공되지 않음. (논문 내용 요약에 포함되지 않음)
👍