Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

M$^3$Prune: Hierarchical Communication Graph Pruning for Efficient Multi-Modal Multi-Agent Retrieval-Augmented Generation

Created by
  • Haebom
Category
Empty

저자

Weizi Shao, Taolin Zhang, Zijie Zhou, Chen Chen, Chengyu Wang, Xiaofeng He

개요

본 논문은 mRAG(multi-modal retrieval-augmented generation) 시스템의 토큰 오버헤드와 계산 비용 문제를 해결하기 위해, 다중 모달 다중 에이전트 계층적 통신 그래프 프루닝 프레임워크인 M$^3$Prune을 제안합니다. M$^3$Prune은 중복된 엣지를 제거하여 성능과 토큰 사용량 사이의 균형을 유지합니다. 텍스트 및 시각적 모달리티 내에서 엣지 선택을 수행하고, 이를 기반으로 동적 통신 토폴로지를 구축한 후, 중복 엣지를 점진적으로 제거하여 효율적인 계층 구조를 얻습니다. 실험 결과는 M$^3$Prune이 단일 에이전트 및 기존 다중 에이전트 시스템보다 우수한 성능을 보이며 토큰 소비를 크게 줄인다는 것을 보여줍니다.

시사점, 한계점

시사점:
mRAG 시스템의 효율성 향상: 토큰 오버헤드 및 계산 비용 감소를 통해 대규모 배포 가능성 증가.
성능 유지: 기존 시스템보다 우수한 성능을 유지하면서 효율성을 개선.
계층적 구조: 다중 에이전트 간의 통신 구조를 최적화하여 정보 전달 효율성 향상.
한계점:
구체적인 구현 및 튜닝에 대한 정보 부족: 실험 설정 및 하이퍼파라미터에 대한 상세 정보가 부족할 수 있음.
일반화 가능성: 특정 벤치마크에 대한 성능이 다른 도메인에도 동일하게 적용될 수 있는지 추가적인 연구 필요.
복잡성: 프루닝 과정의 복잡성으로 인해 구현 및 디버깅의 어려움이 있을 수 있음.
👍