본 논문에서는 다차원 요약 개선의 어려움을 해결하기 위해, 피드백에 대한 반추적 추론을 통해 여러 차원을 향상시키는 강력한 요약 개선 파이프라인인 ReFeed를 제시합니다. 이를 위해, 경량 모델의 반추적 추론 학습에 최적화된 대규모 Long-CoT 기반 데이터셋인 SumFeed-CoT를 공개합니다. 실험을 통해 차원 수, 피드백 노출, 추론 정책이 개선 성능에 미치는 영향을 분석하여, 차원 간의 상충 관계를 완화하기 위해 반추적 추론과 동시에 다중 피드백을 처리하는 것이 중요함을 보여줍니다. 또한, ReFeed는 잡음이 많은 피드백과 피드백 순서에 대해 강건함을 보입니다. 마지막으로, 적절한 목표와 지침을 가진 데이터 생성이 효과적인 추론의 기본적인 기둥임을 강조합니다. 데이터셋과 모델은 공개될 예정입니다.