PRIME (Planning and Retrieval-Integrated Memory for Enhanced Reasoning)은 인간 인지 과정의 이중 처리 이론에서 영감을 얻어 System 1 (빠르고 직관적인 사고)과 System 2 (느리고 신중한 사고)를 동적으로 통합하는 다중 에이전트 추론 프레임워크입니다. PRIME은 먼저 Quick Thinking Agent (System 1)를 사용하여 빠른 답변을 생성하고, 불확실성이 감지되면 계획, 가설 생성, 검색, 정보 통합 및 의사 결정을 위한 특수 에이전트로 구성된 구조화된 System 2 추론 파이프라인을 트리거합니다. LLaMA 3 모델을 사용한 실험 결과는 PRIME이 오픈 소스 LLM이 GPT-4 및 GPT-4o와 같은 최첨단 폐쇄 소스 모델과 경쟁력 있는 성능을 보이도록 함을 보여줍니다.
시사점, 한계점
•
시사점:
◦
다중 에이전트 설계는 인간의 인지 과정을 충실히 모방하여 효율성과 정확성을 향상시킵니다.
◦
오픈 소스 LLM이 복잡한 추론 벤치마크에서 GPT-4 및 GPT-4o와 경쟁할 수 있도록 합니다.
◦
복잡하고 지식 집약적인 추론이 필요한 도메인에서 LLM을 개선하기 위한 확장 가능한 솔루션으로 제시됩니다.