Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

ProtoSiTex: Learning Semi-Interpretable Prototypes for Multi-label Text Classification

Created by
  • Haebom
Category
Empty

저자

Utsav Kumar Nareti, Suraj Kumar, Soumya Pandey, Soumi Chattopadhyay, Chandranath Adak

개요

ProtoSiTex는 fine-grained multi-label 텍스트 분류를 위한 semi-interpretable 프레임워크입니다. 사용자 생성 리뷰의 증가로 인해 해석 가능한 모델의 필요성이 커짐에 따라, ProtoSiTex는 문장 또는 문서 수준에서 작동하는 기존 프로토타입 기반 모델의 한계를 극복하고, 여러 레이블을 처리할 수 있도록 설계되었습니다. ProtoSiTex는 의미론적으로 일관되고 다양한 프로토타입을 학습하는 비지도 프로토타입 발견 단계와, 이러한 프로토타입을 클래스 레이블에 매핑하는 지도 분류 단계로 구성된 이중 단계 교대 훈련 전략을 사용합니다. 계층적 손실 함수는 하위 문장, 문장 및 문서 수준에서 일관성을 유지하며, 적응형 프로토타입과 multi-head attention을 사용하여 중첩되고 상충되는 의미론을 캡처합니다. 호텔 리뷰를 하위 문장 수준에서 여러 레이블로 주석 처리한 새로운 벤치마크 데이터 세트를 도입했습니다. 실험 결과, ProtoSiTex는 state-of-the-art 성능을 달성하면서 인간 친화적인 설명을 제공하며, semi-interpretable multi-label 텍스트 분류를 위한 강력한 솔루션임을 입증했습니다.

시사점, 한계점

시사점:
fine-grained multi-label 텍스트 분류에 적합한 semi-interpretable 프레임워크 제시.
기존 모델의 한계를 극복하고 SOTA 성능 달성.
하위 문장 수준의 주석이 있는 새로운 벤치마크 데이터 세트 도입.
인간 친화적인 설명을 제공하여 해석 가능성 향상.
한계점:
논문에 구체적인 한계점 언급은 없음.
👍