Neural Decoding of Overt Speech from ECoG Using Vision Transformers and Contrastive Representation Learning

Created by

Haebom

저자

Mohamed Baha Ben Ticha, Xingchen Ran, Guillaume Saldanha, Gael Le Godais, Philemon Roussel, Marc Aubert, Amina Fontanell, Thomas Costecalde, Lucas Struber, Serpil Karakas, Shaomin Zhang, Philippe Kahane, Guillaume Charvet, Stephan Chabardes, Blaise Yvert

개요

심각한 마비 환자의 의사소통을 돕는 음성 뇌-컴퓨터 인터페이스(BCI)는 유망한 해결책을 제시한다. 최근 연구들은 표면 전두피질(ECoG) 또는 뇌내 기록으로부터 이해 가능한 음성을 재구성하는 데 성공했다. 본 연구에서는 ECoG 신호로부터 음성을 직접 회귀하여 스트리밍 방식으로 음성을 재구성하는 파이프라인을 제시한다. 이는 비전 트랜스포머와 대조 학습을 통합한 인코더-디코더 딥 뉴럴 아키텍처를 기반으로 한다. 간질 환자에게서 얻은 임상 경막하 전극 데이터셋과, 모터 BCI 시험 참가자에게서 얻은 완전 이식형 WIMAGINE 경막외 시스템 데이터를 사용하여 제안된 접근 방식을 평가한다. 이는 장기간 사용을 위한 전망을 제시하는 완전 이식형 무선 경막외 기록 시스템으로부터 음성을 디코딩하려는 최초의 시도이다.