본 논문은 반투어 중 하나인 쇼나어의 형태학적 분석 및 언어 관련 도구 개발에 대한 연구를 제시합니다. spaCy 프레임워크를 기반으로 구축된 오픈 소스, 규칙 기반의 형태학적 파이프라인인 Shona spaCy를 소개하며, 정제된 JSON 어휘집과 언어학적 기반 규칙을 결합하여 명사 클래스 접두사, 동사 주어 일치, 시제-상 표지, 의성어 및 부착어를 모델링합니다. 이 모든 요소들을 토큰 수준의 주석(표제어, 품사, 형태학적 특징)에 통합했습니다. Shona spaCy는 pip install shona-spacy를 통해 설치 가능하며, 90%의 품사 태깅 정확도와 88%의 형태학적 특징 정확도를 보입니다.