본 논문은 머신러닝 문헌에 기술된 연구 방법론의 코드화를 자동화하기 위해 대규모 언어 모델(LLM) 에이전트를 활용하는 새로운 다중 에이전트 시스템인 ResearchCodeAgent를 소개합니다. 이 시스템은 고차원적 연구 개념과 실제 구현 사이의 간극을 해소하여 연구자들이 기존 연구 논문의 코드를 자동 생성하여 벤치마킹하거나 문헌에 명시된 기존 방법을 기반으로 구축할 수 있도록 합니다. ResearchCodeAgent는 유연한 에이전트 아키텍처와 포괄적인 액션 세트를 사용하여 연구 환경과 상황 인식 상호 작용을 가능하게 합니다. 이 시스템은 단기 및 장기 메모리를 활용하여 반복적으로 접근 방식을 적응시키는 동적 계획 메커니즘을 통합합니다. 데이터 증강, 최적화 및 데이터 배치와 같이 서로 다른 ML 파이프라인의 부분을 나타내는 서로 다른 작업 복잡도를 가진 세 가지 고유한 머신러닝 작업에 대해 ResearchCodeAgent를 평가했습니다. 결과는 생성된 코드의 46.9%가 고품질이고 오류가 없으며 25%는 기준 구현보다 성능이 향상됨을 보여줍니다. 실증 분석에 따르면 수동 구현과 비교하여 코딩 시간이 평균 57.9% 단축되었습니다. 더 복잡한 작업에서 더 높은 이득을 관찰했습니다. ResearchCodeAgent는 연구 구현 프로세스 자동화를 향한 중요한 발걸음을 나타내며 머신러닝 연구의 속도를 높일 수 있습니다.