소멸 위기에 처한 SEN'COTEN 언어의 활성화를 위해, 제한된 데이터와 복잡한 언어 구조(다의성, 스트레스 기반 음운 변이)에도 불구하고, 자동 음성 인식(ASR) 시스템 개발을 시도하였다. 본 연구는 음성 합성(TTS) 시스템을 활용한 데이터 증강과 다국어 전이 학습, 음성 기반 거대 언어 모델(SFM)을 활용한 ASR 기반 문서화 파이프라인을 제안한다. N-gram 언어 모델을 shallow fusion 또는 n-best restoring 방식으로 통합하여 데이터 활용을 극대화하였다. 실험 결과, SEN'COTEN 데이터셋에서 19.34%의 단어 오류율(WER)과 5.09%의 문자 오류율(CER)을 달성하였으며, 세디유 관련 오류 필터링 후 WER은 14.32%, CER은 3.45%로 개선되었다. 이는 제안된 파이프라인이 SEN'COTEN 언어 문서화에 기여할 수 있음을 보여준다.