Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Reasoning Court: Combining Reasoning, Action, and Judgment for Multi-Hop Reasoning

Created by
  • Haebom

저자

Jingtian Wu, Claire Cardie

개요

본 논문에서는 대규모 언어 모델(LLM)의 환각 및 추론 오류 문제를 해결하기 위해, ReAct와 같은 반복적 추론 및 검색 방법을 확장한 새로운 프레임워크인 Reasoning Court (RC)를 제시합니다. RC는 여러 LLM 에이전트가 생성한 후보 답변과 그에 따른 추론 과정을 독립적으로 평가하는 LLM 판사를 활용합니다. 판사는 제시된 추론과 증거를 바탕으로 가장 사실적이고 논리적으로 일관된 답변을 선택하거나, 모든 후보 답변이 부적절하거나 오류가 있는 경우 사용 가능한 증거와 사전 훈련된 지식을 사용하여 새로운 답변을 생성합니다. HotpotQA, MuSiQue, FEVER와 같은 다단계 벤치마크 평가 결과, RC는 과제별 미세 조정 없이 최첨단 몇 번의 시도 프롬프팅 방법을 일관되게 능가하는 것으로 나타났습니다.

시사점, 한계점

시사점:
ReAct와 같은 기존 방법의 한계를 극복하는 새로운 추론 프레임워크 제시
LLM 판사를 통해 추론 과정의 오류를 줄이고 정확도 향상
과제별 미세 조정 없이 최첨단 성능 달성
다양한 다단계 추론 과제에서 효과적인 성능 입증
한계점:
LLM 판사의 신뢰성 및 한계에 대한 추가적인 연구 필요
계산 비용 증가 가능성
복잡한 추론 과정에서 판사의 판단 오류 가능성
특정 유형의 데이터에 대한 편향 가능성 존재
👍