ReflectionCoder는 컴파일러 피드백을 통합하여 생성된 reflection sequence를 활용하여 일회성 코드 생성 성능을 향상시키는 새로운 접근 방식을 제시하는 논문입니다. Reflection self-distillation과 dynamically masked distillation을 제안하여 reflection sequence를 효과적으로 활용하고, HumanEval(+), MBPP(+), MultiPL-E 세 가지 벤치마크에서 최첨단 성능을 달성함을 실험적으로 보여줍니다. 최종 결과에 집중하고 긴 추론 과정을 필요로 하는 다른 분야에도 적용 가능성을 제시합니다.