Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Bridging Information Gaps with Comprehensive Answers: Improving the Diversity and Informativeness of Follow-Up Questions

Created by
  • Haebom

저자

Zhe Liu, Taekyu Kang, Haoyu Wang, Seyed Hossein Alavi, Vered Shwartz

개요

본 논문은 소규모 로컬 모델 기반 대화형 에이전트에서 정보 부족을 해결하는 다양한 후속 질문 생성의 어려움을 다룹니다. 이를 해결하기 위해, 교사 LLM이 포괄적인 답변을 생성하고 초기 답변과 비교하여 정보 격차를 식별하고 격차를 메우는 후속 질문을 공식화하는 정보 격차 기반 지식 증류 파이프라인을 개발했습니다. 이 파이프라인을 사용하여 기존 FollowupQG 데이터셋을 10배 확장하고, 확장된 데이터셋으로 소규모 학생 모델을 미세 조정하여 교사의 지식을 증류했습니다. 선택된 교사-학생 모델 쌍에 대한 실험 결과, 미세 조정된 학생 모델은 원본 데이터셋으로 학습된 변형 모델보다 정보성과 다양성이 현저히 향상됨을 보였습니다. 이는 인간의 정보 탐색 인지 과정을 반영하는 본 파이프라인이 최첨단 LLM에서 소규모 모델로 효율적인 증류 채널을 제공하여 자원 제약이 있는 대화형 시스템에서 더욱 다양하고 정보가 풍부한 후속 질문을 생성할 수 있음을 시사합니다.

시사점, 한계점

시사점:
소규모 로컬 모델에서도 다양하고 정보가 풍부한 후속 질문 생성이 가능하도록 하는 효율적인 지식 증류 파이프라인 제시.
인간의 정보 탐색 인지 과정을 모방한 접근 방식으로 높은 성능 달성.
기존 데이터셋의 10배 확장을 통한 데이터셋의 질적 향상.
최첨단 LLM의 지식을 소규모 모델로 효과적으로 전달하는 방법 제시.
한계점:
특정 교사-학생 모델 쌍에 대한 실험 결과만 제시되어 일반화 가능성에 대한 추가 연구 필요.
사용된 LLM 및 데이터셋의 특성에 따라 성능이 달라질 수 있음.
실제 대화 시스템 적용에 대한 추가적인 평가 필요.
👍