Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

SMAGDi: Socratic Multi Agent Interaction Graph Distillation for Efficient High Accuracy Reasoning

Created by
  • Haebom
Category
Empty

저자

Aayush Aluru, Myra Malik, Samarth Patankar, Spencer Kim, Kevin Zhu, Sean O'Brien, Vasu Sharma

개요

SMAGDi는 계산 비용이 많이 드는 다중 에이전트 시스템(MAS)의 토론 역학을 소형 Socratic 분해-해결사 학생 모델로 이전하는 증류 프레임워크입니다. SMAGDi는 정확성 레이블이 있는 중간 추론 단계와 지속성 및 상호 에이전트 영향을 포착하는 에지를 사용하여 토론 흔적을 방향성 상호 작용 그래프로 나타냅니다. 학생 모델은 언어 모델링, 그래프 기반 감독, 대비 추론 및 임베딩 정렬을 결합한 복합 목표로 훈련되어 유창성과 구조화된 추론을 모두 보존합니다. StrategyQA 및 MMLU에서 SMAGDi는 400억 개의 매개변수를 가진 다중 에이전트 시스템을 60억 개의 매개변수를 가진 학생 모델로 압축하여 정확도의 88%를 유지하며, MAGDi, 표준 KD 및 미세 조정된 기준선과 같은 이전 증류 방법보다 훨씬 뛰어난 성능을 보입니다.

시사점, 한계점

시사점:
다중 에이전트 시스템의 정확성을 유지하면서 효율성을 향상시키는 증류 프레임워크 개발
상호 작용 그래프 모델링과 Socratic 분해가 소형 모델이 다중 에이전트 토론의 정확성 이점을 상속하도록 함
실제 배포에 적합한 효율적인 소형 모델을 통해 MAS의 장점 활용 가능
StrategyQA 및 MMLU에서 기존 증류 방법 및 기준선을 능가하는 우수한 성능
한계점:
SMAGDi의 성능은 특정 태스크(StrategyQA, MMLU)에 국한될 수 있음
다중 에이전트 시스템에서 얻는 이점이 다른 유형의 문제에 어떻게 일반화될 수 있는지 추가 연구 필요
다중 에이전트 시스템과 학생 모델 간의 정확도 차이를 12%로 줄이는 데 한계
👍