Sign In

Zero-Shot and Efficient Clarification Need Prediction in Conversational Search

Created by
  • Haebom
Category
Empty

저자

Lili Lu, Chuan Meng, Federico Ravenda, Mohammad Aliannejadi, Fabio Crestani

개요

본 논문은 대화형 검색에서 사용자 질의에 대한 답변 대신 추가 질문이 필요한지를 예측하는 명확화 필요 예측(CNP) 문제를 다룹니다. 기존 CNP 연구는 학습 데이터 부족과 낮은 효율성 문제를 겪고 있는데, 본 논문에서는 이를 해결하기 위해 제로샷 학습 방식과 효율적인 CNP 프레임워크인 Zef-CNP를 제안합니다. Zef-CNP는 대규모 언어 모델(LLM)을 이용하여 모호한 질의와 명확한 질의 두 가지 유형의 합성 질의를 생성하고, 이를 통해 효율적인 CNP 모델을 학습시킵니다. 합성 질의 생성의 질을 높이기 위해 주제, 정보 필요성, 질의를 고려한 사고 연쇄(CoT) 프롬프팅 전략인 TIQ-CoT와 반실제 질의 생성(CoQu) 기법을 활용합니다. 실험 결과, Zef-CNP는 제로샷 및 퓨샷 LLM 기반 CNP 예측기보다 우수한 효율성과 효과를 보였습니다.

시사점, 한계점

시사점:
제로샷 학습을 통해 사람이 직접 라벨링한 데이터 없이도 CNP 모델을 효과적으로 학습시킬 수 있음을 보여줌.
LLM을 활용하여 효율적인 CNP 모델을 구축함으로써 대화형 검색 시스템의 성능 향상에 기여.
TIQ-CoT와 CoQu 기법을 통해 합성 질의의 질을 향상시켜 CNP 모델의 정확도를 높임.
기존 LLM 기반 CNP 예측기보다 우수한 성능과 효율성을 달성.
한계점:
LLM을 사용하여 합성 데이터를 생성하는 과정에서 LLM의 성능에 의존적이며, LLM의 한계가 Zef-CNP의 성능에 영향을 줄 수 있음.
TIQ-CoT 및 CoQu의 설계가 특정 LLM과 데이터셋에 최적화되어 있을 가능성이 있으며, 다른 환경에서는 성능 저하가 발생할 수 있음.
생성된 합성 데이터의 질에 대한 객관적인 평가 기준이 부족할 수 있음.
실제 사용자 데이터를 이용한 검증이 추가적으로 필요함.
👍