본 논문은 기존의 수동 설계 방식 대신 데이터로부터 메타 러닝 알고리즘을 학습하는 방식이 머신러닝 시스템의 성능 향상을 위한 패러다임으로 주목받고 있음을 다룹니다. 특히 강화 학습(RL)에서 메타 러닝은 유망한 분야로 여겨지고 있으며, 강화 학습에 최적화되지 않은 지도 또는 비지도 학습 알고리즘을 적용하는 경우가 많습니다. 본 논문에서는 블랙박스 함수를 최적화하기 위한 진화 알고리즘이나 코드를 제안하는 대규모 언어 모델(LLM)과 같은 다양한 메타 러닝 알고리즘 간의 실증적 비교를 수행합니다. 다양한 RL 파이프라인에 적용된 메타 학습 알고리즘을 비교 분석하고, 메타 학습 및 메타 테스트 성능 외에도 해석 가능성, 샘플 비용 및 훈련 시간과 같은 요소들을 조사합니다. 이러한 결과를 바탕으로, 향후 학습된 알고리즘의 성능을 최대한 높일 수 있도록 돕는 새로운 RL 알고리즘의 메타 러닝을 위한 몇 가지 지침을 제안합니다.