본 논문은 기존의 다중 에이전트 참조 게임을 통한 언어 학습 연구와 달리, 에이전트의 자기 학습을 통한 내적 언어 발달에 초점을 맞추고 있습니다. 단독 에이전트가 자기 게임(self-play)을 통해 기호적 표현을 생성하고 직접 경사 하강법으로 학습하는 과정을 다룹니다. 기존 REINFORCE 방법의 한계를 극복하기 위해, 벡터 양자화(Vector Quantization)를 통합한 새로운 방법인 VQEL을 제시합니다. VQEL은 에이전트가 자율적으로 이산적 기호 표현을 발명하고 발전시키도록 하며, 자기 게임 단계 이후 상호 게임(mutual-play) 단계를 통해 다른 에이전트와의 상호 작용으로 언어 능력을 향상시킵니다. 다양한 데이터셋 실험 결과, VQEL은 기존 REINFORCE 방법보다 성능이 우수하며, 벡터 양자화를 통해 제어력 향상 및 붕괴 현상 감소 효과를 보였습니다.