Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

ECLM: Entity Level Language Model for Spoken Language Understanding with Chain of Intent

Created by
  • Haebom

저자

Shangjian Yin, Peijie Huang, Jiatian Chen, Haojing Huang, Yuhong Xu

개요

대규모 언어 모델(LLM)의 음성 언어 이해(SLU) 적용 시 발생하는 토큰 수준 작업의 정렬 문제와 미묘한 의미 관계 포착의 어려움을 해결하기 위해, 슬롯 채우기를 개체 인식 작업으로 재구성하고, 단계별 다중 의도 인식을 가능하게 하는 새로운 개념인 "의도 체인"을 도입하는 Entity-level Language Model(ECLM) 프레임워크를 제안한다. ECLM은 MixATIS에서 3.7%, MixSNIPS에서 3.1%의 성능 향상을 보였으며, LLM의 표준 지도 학습 방식보다 각각 8.5% 및 21.2%의 성능 향상을 달성했다.

시사점, 한계점

시사점:
ECLM 프레임워크는 LLM을 SLU에 효과적으로 적용하는 새로운 접근 방식을 제시함.
슬롯 채우기를 개체 인식으로 재구성하여 토큰 수준의 정렬 문제를 해결.
"의도 체인" 개념 도입으로 다중 의도 인식을 개선.
강력한 기반 모델 및 표준 지도 학습 방식보다 우수한 성능을 달성함.
한계점:
논문에 명시된 한계점은 제시되지 않음.
👍