Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

PARL-MT: Learning to Call Functions in Multi-Turn Conversation with Progress Awareness

Created by
  • Haebom

저자

Huacan Chai, Zijie Cao, Maolin Ran, Yingxuan Yang, Jianghao Lin, pengxin, Hairui Wang, Renjie Ding, Ziyu Wan, Muning Wen, Weiwen Liu, Weinan Zhang, Fei Huang, Ying Wen

개요

본 논문은 대규모 언어 모델(LLM)이 다중 턴 대화에서 기능 호출을 수행하는 데 있어, 진행 상황 인식, 과거 상호 작용 요약, 향후 작업 계획을 유지하는 데 어려움이 있다는 점을 지적하고, 이를 해결하기 위해 PARL-MT 프레임워크를 제안한다. PARL-MT는 진행 상황 인식 생성(PAG) 파이프라인을 통해 대화 요약과 미래 작업 계획을 결합한 데이터세트를 구축하고, 진행 상황 인식 기반 강화 학습(PAG-RL) 알고리즘을 활용하여 문맥적 중복을 줄이고, 국부적인 행동과 전체 작업 완료 간의 정렬을 개선한다. 실험 결과는 PARL-MT가 기존 방법보다 우수함을 보여준다.

시사점, 한계점

시사점:
진행 상황 인식을 LLM의 다중 턴 기능 호출 훈련에 명시적으로 통합하여 성능을 향상시킴.
PAG 파이프라인을 통해 대화 요약과 작업 계획을 결합한 데이터세트를 자동 구축하여 훈련 효율성을 높임.
PAG-RL 알고리즘을 통해 강화 학습 과정에서 문맥 중복을 줄이고, 전반적인 작업 완성을 개선함.
두 개의 공개 벤치마크에서 기존 방법보다 우수한 성능을 입증함.
한계점:
제시된 방법의 일반화 가능성 및 다른 유형의 다중 턴 작업에 대한 적용 가능성은 추가 연구가 필요함.
PAG 파이프라인의 자동 생성 품질에 따른 성능 변화에 대한 분석이 부족함.
PARL-MT의 복잡성과 계산 비용에 대한 구체적인 언급이 없음.
👍