Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

AgentMaster: A Multi-Agent Conversational Framework Using A2A and MCP Protocols for Multimodal Information Retrieval and Analysis

Created by
  • Haebom

저자

Callie C. Liao, Duoduo Liao, Sai Surya Gadiraju

개요

본 논문은 대규모 언어 모델(LLM)과 통합된 다중 에이전트 시스템(MAS)의 복잡한 작업 해결 능력 향상에 초점을 맞추고 있습니다. 기존 시스템의 에이전트 간 통신, 조정 및 이종 도구 및 리소스와의 상호 작용의 어려움을 해결하기 위해, Anthropic의 Model Context Protocol (MCP)과 Google의 Agent-to-Agent (A2A) 통신 프로토콜을 모두 활용하는 새로운 모듈형 다중 프로토콜 MAS 프레임워크인 AgentMaster를 제시합니다. AgentMaster는 자체 구현된 A2A와 MCP를 통해 동적 조정, 유연한 통신 및 빠른 반복 개발을 가능하게 합니다. 통합된 대화형 인터페이스를 통해 기술 전문 지식 없이도 자연어 상호 작용을 지원하며, 정보 검색, 질문 답변 및 이미지 분석 등의 작업을 위한 다중 모드 쿼리에 응답합니다. BERTScore F1 (96.3%) 및 LLM-as-a-Judge G-Eval (87.1%)과 같은 정량적 지표와 인간 평가를 통해 실험의 유효성을 검증하였으며, 강력한 자동 에이전트 간 조정, 쿼리 분해, 작업 할당, 동적 라우팅 및 도메인 특정 관련 응답을 보여줍니다. 결론적으로 AgentMaster는 MAS 기반의 도메인 특정, 협력적이고 확장 가능한 대화형 AI의 잠재력에 기여합니다.

시사점, 한계점

시사점:
MCP와 A2A 프로토콜을 통합한 새로운 MAS 프레임워크 AgentMaster 제시
자연어 기반의 다중 모드 쿼리 지원으로 사용자 친화적인 인터페이스 제공
자동화된 에이전트 간 조정, 쿼리 분해, 작업 할당 및 동적 라우팅 기능 구현
높은 성능 지표 (BERTScore F1 96.3%, LLM-as-a-Judge G-Eval 87.1%) 달성
도메인 특정, 협력적이고 확장 가능한 대화형 AI 개발 가능성 제시
한계점:
Pilot study로 제한된 규모의 실험 진행
다양한 도메인 및 복잡한 작업에 대한 추가적인 실험 필요
AgentMaster의 확장성 및 안정성에 대한 추가적인 검증 필요
프레임워크의 구체적인 구현 세부 사항 및 소스 코드 공개 부족
👍