본 논문은 희소 보상 문제를 해결하기 위해 보상 형성을 활용하는 새로운 다중 작업 강화 학습 프레임워크를 제안합니다. 이 프레임워크는 중앙 집중식 보상 에이전트(CRA)와 여러 분산 정책 에이전트를 통합합니다. CRA는 다양한 작업으로부터 지식을 추출하여 개별 정책 에이전트에 분배하여 학습 효율성을 향상시키는 지식 풀 역할을 합니다. 형상화된 보상은 지식을 인코딩하는 데 사용됩니다. 이 프레임워크는 기존 작업 간의 지식 공유를 향상시킬 뿐만 아니라 의미 있는 보상 신호를 전송하여 새로운 작업에도 적응합니다. 제안된 방법은 Meta-World 벤치마크를 포함한 이산 및 연속 도메인에서 검증되었으며, 다중 작업 희소 보상 설정에서 견고성과 미지의 작업에 대한 전송성을 입증했습니다.