MAPS: A Multi-Agent Framework Based on Big Seven Personality and Socratic Guidance for Multimodal Scientific Problem Solving
Created by
Haebom
Category
Empty
저자
Jian Zhang, Zhiyuan Wang, Zhangqi Wang, Xinyu Zhang, Fangzhi Xu, Qika Lin, Rui Mao, Erik Cambria, Jun Liu
개요
본 논문은 다중 모달 과학 문제(MSPs) 해결을 위한 다중 에이전트 프레임워크인 MAPS(Multi-Agent framework based on the Big Seven Personality and Socratic guidance)를 제안한다. MAPS는 텍스트와 다이어그램 등 다양한 모달리티를 통합해야 하는 복잡한 과학 문제 해결에 초점을 맞춘다. 기존 과학 문제 해결에서의 발전에도 불구하고, MSPs는 다중 모달 포괄적 추론과 반성적 재사고 능력 부족이라는 두 가지 주요 문제에 직면한다. MAPS는 이러한 문제를 해결하기 위해, 문제 해결 과정의 각 단계에 집중하는 네 가지 에이전트와 소크라테스적 질문을 통해 비판적 사고와 자율 학습을 촉진하는 비평가 에이전트를 포함한다. EMMA, Olympiad, MathVista 데이터셋을 사용한 실험 결과, 기존 최고 성능 모델보다 15.84% 향상된 성능을 보였다. 추가 분석 실험을 통해 모델의 발전 및 일반화 능력도 확인되었다.
시사점, 한계점
•
시사점:
◦
다중 모달 과학 문제 해결을 위한 새로운 다중 에이전트 프레임워크 MAPS 제시.
◦
소크라테스식 질문 기반의 비판적 사고 및 자율 학습 촉진.
◦
EMMA, Olympiad, MathVista 데이터셋에서 기존 최고 성능 모델 대비 15.84% 성능 향상.