본 논문은 대규모 언어 모델(LLM) 기반 에이전트 최적화 방법에 대한 종합적인 검토를 제공합니다. 기존 연구들이 일반적인 LLM에 프롬프트 엔지니어링이나 미세 조정 전략을 적용하는 데 의존하여 복잡한 환경에서 효과가 제한적이었던 점을 지적하며, 장기 계획, 동적 환경 상호 작용, 복잡한 의사 결정과 같은 에이전트 기능에 특화된 최적화의 필요성을 강조합니다. 논문에서는 매개변수 기반(파라미터 기반) 최적화와 매개변수 비기반(파라미터 비기반) 최적화 방법으로 분류하여 다양한 최적화 전략을 체계적으로 검토합니다. 매개변수 기반 최적화는 미세 조정 기반 최적화, 강화 학습 기반 최적화, 하이브리드 전략을 포함하며, 궤적 데이터 구성, 미세 조정 기법, 보상 함수 설계, 최적화 알고리즘 등의 핵심 측면을 분석합니다. 또한, 프롬프트 엔지니어링 및 외부 지식 검색을 통해 에이전트 동작을 최적화하는 매개변수 비기반 전략을 간략하게 논의하고, 평가 및 조정에 사용된 데이터셋과 벤치마크를 요약하며, LLM 기반 에이전트의 주요 응용 분야와 주요 과제 및 미래 방향을 논의합니다. 관련 참고 자료는 GitHub 저장소에서 확인할 수 있습니다.