[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Label-semantics Aware Generative Approach for Domain-Agnostic Multilabel Classification

Created by
  • Haebom

저자

Subhendu Khatuya, Shashwat Naidu, Saptarshi Ghosh, Pawan Goyal, Niloy Ganguly

개요

본 논문은 급증하는 텍스트 데이터의 수동 분류의 어려움을 해결하기 위해, 도메인에 독립적인 강력하고 효율적인 생성 모델 프레임워크 LAGAMC를 제안합니다. 기존의 레이블을 원자적 기호로 취급하는 대신, 미리 정의된 레이블 설명을 활용하여 입력 텍스트를 기반으로 이러한 설명을 생성하도록 모델을 학습시킵니다. 추론 과정에서는 미세 조정된 문장 변환기를 사용하여 생성된 설명을 미리 정의된 레이블과 일치시킵니다. 교차 엔트로피 손실과 생성된 문장과 미리 정의된 대상 설명의 코사인 유사도를 결합한 이중 목적 손실 함수를 통합하여 의미적 정렬과 정확도를 모두 보장합니다. LAGAMC는 매개변수 효율성과 다양한 데이터 세트에 대한 다용성으로 인해 실제 응용 프로그램에 적합합니다. 실험 결과, 평가된 모든 데이터 세트에서 기존 최고 성능을 능가하며, 가장 가까운 기준 모델에 비해 Micro-F1에서 13.94%, Macro-F1에서 24.85% 향상된 성능을 달성했습니다.

시사점, 한계점

시사점:
다양한 데이터셋에서 기존 최고 성능(SOTA)을 뛰어넘는 성능을 보임.
매개변수 효율성이 높아 실용적인 응용에 적합.
도메인에 독립적이어서 다양한 분야에 적용 가능.
레이블 설명을 활용하여 의미적으로 풍부한 분류 가능.
한계점:
레이블 설명의 질에 따라 성능이 영향을 받을 수 있음. (Predefined label descriptions의 질에 대한 논의 부족)
제안된 모델의 일반화 성능에 대한 추가적인 실험이 필요할 수 있음. (다양한 데이터셋에 대한 실험 결과 제시는 되었으나, 일반화 성능에 대한 명확한 논의 부족)
특정한 유형의 텍스트 데이터에 대한 성능 저하 가능성 존재. (특정 텍스트 유형에 대한 실험 결과 부족)
👍