AgentRxiv는 LLM 에이전트들이 공유 프리프린트 서버를 통해 연구 결과를 업로드하고 검색하여 공동 연구, 통찰력 공유, 그리고 반복적인 연구 발전을 가능하게 하는 프레임워크입니다. 기존 에이전트 워크플로우의 한계인 고립된 연구를 극복하기 위해 고안되었으며, MATH-500 벤치마크에서 독립적으로 작동하는 에이전트 대비 11.4%의 성능 향상을 보였습니다. 이러한 성능 향상은 다른 도메인의 벤치마크에서도 평균 3.3%의 개선으로 일반화되었고, 여러 에이전트 연구소가 AgentRxiv를 통해 협업할 경우 MATH-500에서 13.7%의 성능 향상을 달성했습니다. 이는 자율 에이전트가 인간과 함께 미래 AI 시스템 설계에 기여할 수 있음을 시사합니다.