본 논문은 오픈소스 사전 훈련된 거대 언어 모델(LLM)을 이용하여 과학 연구의 전 과정(문헌 검토, 논문 작성, 동료 검토, 논문 수정)을 자동화하는 가능성을 탐구합니다. CycleResearcher와 CycleReviewer라는 두 개의 모델로 구성된 반복적 선호도 훈련 프레임워크를 제시하며, 실제 기계 학습 연구 및 동료 검토 역학을 반영하는 두 개의 새로운 데이터셋(Review-5k, Research-14k)을 개발했습니다. CycleReviewer는 논문 점수 예측에서 인간 평가자 대비 평균 절대 오차(MAE)를 26.89% 감소시키는 성능을 보였고, CycleResearcher가 생성한 논문은 모의 동료 검토에서 5.36점을 받아 인간 전문가의 프리프린트 수준(5.24점)과 비교하여 경쟁력을 보였습니다. 본 연구는 윤리적 안전장치와 AI 기반 연구 기능을 탐구하며, 완전 자동화된 과학 연구를 향한 중요한 발걸음을 내딛었습니다. 코드, 데이터셋, 모델 가중치는 공개되었습니다.