BlendRL은 신경망 기반 정책과 심볼릭 기반 정책을 결합한 새로운 강화학습 프레임워크입니다. 기존의 신경망 기반 에이전트는 해석이 어렵고, 심볼릭 기반 에이전트는 유연성이 부족하다는 한계를 극복하기 위해, 두 방식을 조화롭게 통합하여 에이전트의 성능과 해석력을 향상시키는 것을 목표로 합니다. BlendRL은 논리와 신경망 정책의 혼합을 사용하는 RL 에이전트를 통해 표준 Atari 환경에서 신경망 및 심볼릭 기반 기준 모델보다 우수한 성능을 보이며, 환경 변화에 대한 강건성도 보여줍니다. 또한, 신경망 및 심볼릭 정책 간의 상호작용을 분석하여 하이브리드 사용이 각 정책의 한계를 극복하는 데 어떻게 도움이 되는지 보여줍니다.