Alicia P. Wolfe, Oliver Diamond, Brigitte Goeler-Slough, Remi Feuerman, Magdalena Kisielinska, Victoria Manfredi
개요
본 논문은 하나의 에이전트가 자신을 여러 번 복제하여 단일 에이전트 작업을 더 잘 또는 더 효율적으로 수행하는 새로운 유형의 다중 에이전트 문제를 조사합니다. 이 전략은 환경이 노이즈가 많고 작업이 단일 에이전트 복제본으로는 달성할 수 없는 경우 성능을 향상시킵니다. 본 논문에서는 추가 복제본의 장점과 비용을 효율적으로 균형을 맞추는 방법을 학습하기 위해 값 함수의 구조를 활용하는 다중 복제 문제에 대한 학습 알고리즘을 제안합니다.