AgentPSO: Evolving Agent Reasoning Skill via Multi-agent Particle Swarm Optimization

작성자

Haebom

카테고리

Empty

저자

Hyunmin Hwang, Jaemin Kim, Choonghan Kim, Hangeol Chang, Jong Chul Ye

💡 개요

본 논문은 다중 에이전트 추론 시 발생할 수 있는 잘못된 동료 영향 및 편향된 합의 문제를 해결하기 위해, 입자 군집 최적화(PSO)에서 영감을 받은 AgentPSO 프레임워크를 제안한다. AgentPSO는 각 에이전트를 자연어 기술을 상태로, 의미론적 업데이트 방향을 속도로 가지는 입자형 추론자로 취급하여, 개인 및 집단 추론 성능 향상을 위해 더 강력한 기술 상태로 반복적으로 발전시킨다.

🔑 시사점 및 한계

•

에이전트의 추론 기술을 백본 언어 모델의 파라미터 업데이트 없이 학습 및 발전시킬 수 있다.

•

개인 및 집단 추론 성능 향상뿐만 아니라, 학습된 기술이 여러 벤치마크와 다른 백본 모델로 전이될 수 있음을 실험적으로 입증했다.

•

벤치마크별 프롬프트 최적화를 넘어선 재사용 가능한 추론 절차를 포착하는 것으로 보인다.

•

AgentPSO의 성능은 에이전트 간의 초기 기술 상태 분포나 경쟁 정도에 따라 달라질 수 있으며, 복잡하거나 창의적인 추론이 요구되는 태스크에서는 추가적인 개선이 필요할 수 있다.

PDF 보기

Made with Slashpage