본 논문은 기존의 수동 설계 방식 대신 데이터로부터 메타 학습 알고리즘을 학습하는 방법이 머신러닝 시스템 성능 향상에 대한 패러다임으로 주목받고 있는 상황에서, 특히 강화 학습(RL) 분야에 초점을 맞추고 있다. 강화 학습 알고리즘은 종종 최적이 아닌 지도 학습이나 비지도 학습에서 파생되지만, 메타 학습은 이러한 문제를 해결할 가능성을 제시한다. 본 연구는 블랙박스 함수 최적화를 위한 진화 알고리즘이나 코드 제안을 위한 대규모 언어 모델(LLM)과 같이 서로 다른 메타 학습 알고리즘들을 다양한 RL 파이프라인에 적용하여 실험적으로 비교 분석한다. 메타 학습 및 메타 테스트 성능 외에도 해석 가능성, 샘플 비용, 학습 시간 등의 요소들을 조사하여, 향후 더욱 성능이 뛰어난 RL 알고리즘을 메타 학습하기 위한 몇 가지 지침을 제안한다.