본 논문은 대규모 언어 모델(LLM)의 추론 과정에서의 에너지 소모 문제를 해결하기 위한 프레임워크인 GREEN-CODE를 제안한다. GREEN-CODE는 강화학습(RL) 에이전트를 활용하여 LLM 추론 중 동적으로 조기 종료(early exit)를 수행함으로써 정확도, 지연 시간, 에너지 소비량 간의 균형을 맞춘다. Llama 3.2 3B와 OPT 2.7B 두 개의 오픈소스 LLM과 JavaCorpus 및 PY150 데이터셋을 사용하여 평가한 결과, 코드 생성 작업에서 평균 23-50%의 에너지 소비 감소를 달성하면서 정확도는 크게 저하되지 않았음을 보였다.