본 논문은 대규모 언어 모델(LLM)을 활용하여 대학생들의 프로그래밍 입문 과정에서 학생들에게 피드백을 제공하는 방안을 연구합니다. GPT-3.5T와 GPT-4T 두 모델의 성능을 평가한 결과, GPT-4T가 GPT-3.5T보다 훨씬 우수하지만 부정확한 정보를 생성할 가능성이 있어 실제 적용에는 미흡함을 보였습니다. 이에 따라, 문맥 학습 기법을 활용한 신중하게 설계된 프롬프트를 제안하여 평가 과정의 자동화 및 부정확한 피드백 비율의 하한선을 제공하는 방법을 제시합니다. 마지막으로, 제안된 프롬프트 기법을 기반으로 실용적인 학습 도구 구현 전략을 제시하고, 이를 통한 교육적 가능성을 논의합니다.