EEG2TEXT-CN은 중국어에 특화된 최초의 오픈 보카불러리 뇌파-텍스트 생성 프레임워크 중 하나입니다. 생물학적으로 근거한 EEG 인코더(NICE-EEG)와 소형 사전 훈련된 언어 모델(MiniLM)을 기반으로, 마스크 사전 훈련 및 대조 학습을 통해 다채널 뇌파 신호와 자연어 표현을 정렬합니다. 중국어EEG 데이터셋의 하위 집합(각 문장은 약 10개의 중국어 문자와 256Hz로 기록된 128채널 EEG가 정렬됨)을 사용하여, EEG를 문자별 임베딩으로 분할하고 제로샷 설정에서 전체 문장을 예측합니다. 디코더는 가변 길이 시퀀스를 수용하기 위해 강제 교사 학습과 패딩 마스크로 훈련됩니다. 1,500개 이상의 훈련-검증 문장과 300개의 테스트 샘플에 대한 평가 결과, 최고 BLEU-1 점수가 6.38%로 유망한 어휘 정렬을 보여줍니다. 구문 유창성은 여전히 과제이지만, 이 연구는 비음성적이고 크로스 모달적인 EEG로부터의 언어 디코딩의 가능성을 보여줍니다. 이 연구는 다국어 뇌-텍스트 연구에 새로운 방향을 제시하고 중국어를 위한 미래의 인지-언어 인터페이스의 기반을 마련합니다.