본 논문은 대규모 언어 모델(LLM)을 활용한 주식 리서치 보고서(ERR) 자동 생성 연구를 최초로 제시한다. 데이터 부족과 평가 지표 부재 문제를 해결하기 위해, ERR 생성을 위한 오픈 소스 평가 벤치마크 FinRpt를 제안한다. 7가지 금융 데이터를 통합하여 고품질 ERR 데이터 세트를 자동 생성하는 데이터 세트 구축 파이프라인을 구축하고, 생성된 ERR을 평가하기 위한 11가지 지표를 포함하는 포괄적인 평가 시스템을 도입한다. 또한, 이 작업에 특화된 다중 에이전트 프레임워크 FinRpt-Gen을 제안하고, 제안된 데이터 세트에서 지도 미세 조정 및 강화 학습을 통해 여러 LLM 기반 에이전트를 학습시킨다. 실험 결과는 벤치마크 FinRpt의 데이터 품질과 지표의 효과, FinRpt-Gen의 강력한 성능을 보여주며, ERR 생성 분야의 혁신을 이끌 잠재력을 입증한다. 모든 코드와 데이터 세트는 공개적으로 제공된다.