Daily Arxiv

This page organizes papers related to artificial intelligence published around the world.
This page is summarized using Google Gemini and is operated on a non-profit basis.
The copyright of the paper belongs to the author and the relevant institution. When sharing, simply cite the source.

Passive Dementia Screening via Facial Temporal Micro-Dynamics Analysis of In-the-Wild Talking-Head Video

Created by
  • Haebom
Category
Empty

저자

Filippo Cenacchi, Longbing Cao, Mitchell McEwan, Deborah Richards

개요

단기 카메라 정면 대화형 비디오에서 수동적인 치매 선별을 목표로, 언어 없이 초기 신경 인지 변화를 감지하기 위해 안면 시간 미세 역학 분석을 개발했습니다. 임상의나 연구자의 적극적인 개입 없이, 장치, 주제 및 문화를 넘나드는 자연스러운 안면 행동을 포착하기 위해 대규모로, 현장에서 스크립트 없는 비디오 분석을 가능하게 합니다. 말이나 스크립트 인터뷰를 우선시하는 기존 자료와 달리, 말이나 텍스트 없이 눈 깜빡임 역학, 작은 입/턱 움직임, 시선 변동, 미세한 머리 조정을 포함한 시간적 안면 운동학이 치매 선별에 충분한지 분석합니다. 안면 신호를 안정화하여 이러한 미세 움직임을 해석 가능한 안면 미세 역학 시계열로 변환하고, 이를 매끄럽게 처리하여 짧은 창을 압축된 클립 수준 통계로 요약합니다. 각 창은 활동 혼합(스트림 간의 움직임의 상대적 비율)에 의해 인코딩되므로, 예측 변수는 채널별 효과를 투명하게 만들어 움직임의 크기가 아닌 스트림 간의 움직임 분포를 분석합니다. 또한, 공개적으로 이용 가능한 현장 카메라 정면 비디오에서 큐레이션된 새로운 데이터 세트인 YT DemTalk를 도입했습니다. 이 데이터 세트는 모델을 테스트하고 코퍼스에 대한 첫 번째 벤치마킹을 제공하기 위해 300개의 클립(자가 보고 치매 150개, 대조군 150개)을 포함합니다. YT DemTalk에서, 눈의 불안정성과 입/턱 역학이 가장 유익한 단서로 식별되었으며, 경량 얕은 분류기는 0.953의 AUROC, 0.961의 평균 정밀도(AP), 0.851의 F1 점수, 0.857의 정확도로 치매 예측 성능을 달성할 수 있었습니다.

시사점, 한계점

시사점:
언어적 요소 없이, 자연스러운 안면 행동 분석을 통해 치매를 선별할 수 있는 새로운 접근 방식을 제시합니다.
광범위한 환경에서 사용 가능하고, 다양한 장치 및 문화에 적용 가능한, 확장 가능한 치매 선별 방법을 제공합니다.
새로운 데이터 세트 YT DemTalk를 통해 이 분야의 연구 발전을 촉진합니다.
시선 변화와 입/턱 움직임과 같은 특정 안면 특징이 치매 선별에 유용함을 밝혀냈습니다.
높은 정확도와 성능을 보이는 경량 모델을 제시하여, 실제 적용 가능성을 높였습니다.
한계점:
연구에 사용된 데이터 세트 YT DemTalk의 규모가 상대적으로 작습니다(300개의 클립).
본 연구 결과가 다른 인구 집단이나 더 다양한 환경에서 동일한 성능을 보일지 검증이 필요합니다.
데이터 수집 및 분석 과정에서 발생할 수 있는 잠재적인 편향을 고려해야 합니다.
모델의 일반화 가능성을 높이기 위해 더 많은 데이터와 더욱 복잡한 모델을 사용한 추가 연구가 필요할 수 있습니다.
윤리적인 측면(개인 정보 보호)에 대한 고려가 필요합니다.
👍