Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

NILC: Discovering New Intents with LLM-assisted Clustering

Created by
  • Haebom
Category
Empty

저자

Hongtao Wang, Renchi Yang, Wenqing Lin

NILC: 효과적인 새로운 의도 발견을 위한 클러스터링 프레임워크

개요

본 논문은 레이블이 없는 사용자 발화로부터 새로운 의도와 기존 의도를 모두 인식하는 새로운 의도 발견 (NID) 문제를 해결하기 위해, NILC라는 새로운 클러스터링 프레임워크를 제안합니다. NILC는 반복적인 워크플로우를 따르며, 클러스터 중심점과 불확실한 발화의 텍스트 임베딩을 대규모 언어 모델 (LLM)을 사용하여 정교하게 개선합니다. 특히, LLM을 활용하여 클러스터에 대한 추가적인 의미 중심점을 생성하여 임베딩의 유클리드 중심점의 맥락적 의미를 풍부하게 합니다. 또한 LLM을 활용하여 클러스터에서 식별된 어려운 샘플 (모호하거나 간결한 발화)을 재작성하여 클러스터 수정을 수행합니다. 반지도 학습 설정에서 더 정확한 NID를 위해 seeding 및 soft must links와 같은 기법을 통해 감독 신호를 주입합니다. 다양한 도메인의 6개의 벤치마크 데이터 세트에 대한 광범위한 실험을 통해 NILC가 여러 최신 기준선보다 유의미한 성능 향상을 달성함을 입증합니다.

시사점, 한계점

시사점:
새로운 의도 발견 문제에 대한 새로운 클러스터링 프레임워크 제시.
LLM을 활용하여 클러스터 중심점 및 텍스트 임베딩 개선.
반복적인 워크플로우를 통해 클러스터링 할당을 정교하게 업데이트.
다양한 데이터 세트에서 기존 방법론 대비 우수한 성능 입증.
한계점:
LLM 의존성으로 인한 계산 비용 및 지연 가능성.
세부적인 구현 및 파라미터 튜닝에 대한 정보 부족.
새로운 의도 발견에 대한 일반화 가능성 추가 연구 필요.
👍