ProtoSiTex는 fine-grained multi-label 텍스트 분류를 위한 semi-interpretable 프레임워크입니다. 사용자 생성 리뷰의 증가로 인해 해석 가능한 모델의 필요성이 커짐에 따라, ProtoSiTex는 문장 또는 문서 수준에서 작동하는 기존 프로토타입 기반 모델의 한계를 극복하고, 여러 레이블을 처리할 수 있도록 설계되었습니다. ProtoSiTex는 의미론적으로 일관되고 다양한 프로토타입을 학습하는 비지도 프로토타입 발견 단계와, 이러한 프로토타입을 클래스 레이블에 매핑하는 지도 분류 단계로 구성된 이중 단계 교대 훈련 전략을 사용합니다. 계층적 손실 함수는 하위 문장, 문장 및 문서 수준에서 일관성을 유지하며, 적응형 프로토타입과 multi-head attention을 사용하여 중첩되고 상충되는 의미론을 캡처합니다. 호텔 리뷰를 하위 문장 수준에서 여러 레이블로 주석 처리한 새로운 벤치마크 데이터 세트를 도입했습니다. 실험 결과, ProtoSiTex는 state-of-the-art 성능을 달성하면서 인간 친화적인 설명을 제공하며, semi-interpretable multi-label 텍스트 분류를 위한 강력한 솔루션임을 입증했습니다.