본 논문은 분산 다중 에이전트 강화 학습(MARL)에서 자발적인 의사소통의 출현을 제한하는 '공동 탐색 딜레마'와 '의사소통 공백 평형' 문제를 다룹니다. 기존 연구는 의사소통 출현을 촉진하기 위해 귀납적 편향을 도입하는 데 집중했지만, 본 연구는 이러한 인위적인 귀납적 편향이 과도한 공학인지에 대한 근본적인 질문을 제기합니다. 벡터 양자화 변분 오토인코더(VQ-VAE) 기반의 'AI 모국어'(AIM) 프레임워크를 사용한 실험을 통해, 에이전트가 내생적 기호 시스템을 가지고 있을 때, 그들의 신경망 표현이 자연스럽게 자발적인 의미 압축과 내쉬 평형 기반 의미 수렴을 보이며 외부 귀납적 편향 없이 효과적인 상징적 의사소통을 달성함을 보여줍니다. 이는 인간 뇌가 내적 사고에 인간 언어를 직접 사용하지 않는다는 최근 신경과학적 발견과 대규모 언어 모델(LLM)의 '소프트 사고' 능력에 대한 연구와 일맥상통합니다. AIM은 기존의 명시적인 의사소통 방법에 비해 더 강력한 일반성과 효율성을 보여줍니다. 개발된 해석 가능한 분석 도구 키트는 기호 사용이 유의미한 지수 법칙 분포를 나타냄을 확인하며, '신경 의사소통 가설', '도구 우선 원칙', '의미 해석 가능성 패러다임'이라는 세 가지 주요 이론적 통찰력을 제시합니다. 향후 연구는 계층적 양자화 변분 오토인코더(HQ-VAE) 통합을 통해 AIM의 복잡한 표현 능력을 향상시키고 '강화 학습(RL) 저수준 사전 훈련'의 잠재력을 조사할 것입니다. 이 발견은 상징주의와 연결주의를 연결하는 새로운 길을 제시합니다.