Improving Human-AI Coordination through Online Adversarial Training and Generative Models
Created by
Haebom
저자
Paresh Chaudhary, Yancheng Liang, Daphne Chen, Simon S. Du, Natasha Jaques
개요
본 논문은 새로운 사람들과 협력하는 능력이 가정용 로봇 공학에서 자율 주행에 이르기까지 많은 경제적 가치가 있는 AI 작업의 중요한 구성 요소임을 지적합니다. 그러나 새로운 사람들에게 일반화하려면 인간 행동의 다양성을 포착하는 데이터를 사용하여 훈련해야 합니다. 적대적 훈련은 동적 데이터 생성을 허용하고 에이전트가 견고하도록 보장하는 유망한 방법입니다. 에이전트의 성능이 새로운 적대적 데이터 생성에 영향을 미치고 이 데이터를 즉시 에이전트 훈련에 사용할 수 있는 피드백 루프를 만듭니다. 그러나 협력적 작업에 적대적 훈련을 적용하기는 어렵습니다. 어떻게 적대적 협력자를 훈련할 수 있을까요? 본 논문에서는 사전 훈련된 생성 모델을 사용하여 유효한 협력 에이전트 정책을 시뮬레이션하고 적대적 훈련을 사용하여 후회를 최대화하는 새로운 전략인 GOAT(Generative Online Adversarial Training)를 제안합니다. GOAT 프레임워크에서 GOAT는 학습 정책인 협력자 에이전트가 저성능을 보이는 조정 전략에 대해 생성 모델의 잠재 공간을 동적으로 검색합니다. GOAT는 다양한 어려운 상호 작용 시나리오에 협력자를 노출시켜 더 나은 일반화를 가능하게 합니다. 생성 모델을 고정하여 적대적 악용을 피함으로써 현실적인 조정 전략을 유지합니다. 실제 인간 파트너를 사용하여 GOAT를 평가했으며, 결과는 Overcooked 벤치마크에서 최첨단 성능을 보여주어 다양한 인간 행동에 대한 일반화 효과를 강조합니다.
시사점, 한계점
•
시사점:
◦
사전 훈련된 생성 모델과 적대적 훈련을 결합하여 협력적 AI 에이전트를 효과적으로 훈련하는 새로운 방법(GOAT)을 제시합니다.
◦
다양한 인간 행동에 대한 일반화 능력을 향상시켜 실제 세계 적용 가능성을 높입니다.
◦
Overcooked 벤치마크에서 최첨단 성능을 달성하여 방법의 효과성을 입증합니다.
•
한계점:
◦
생성 모델의 품질에 의존하며, 생성 모델이 부정확하거나 불완전한 경우 성능이 저하될 수 있습니다.
◦
Overcooked 벤치마크에 대한 평가 결과만 제시되어 다른 작업에 대한 일반화 가능성은 불확실합니다.