본 논문은 다중 에이전트 시스템(MAS)에서 에이전트의 고유한 가치(innate values)를 기반으로 한 의사결정 및 학습 모델을 제안합니다. 기존 강화학습 기반 MAS 모델들이 개별 에이전트의 니즈를 충분히 고려하지 못하는 한계를 극복하고자, 개별 에이전트의 선호도를 반영하는 일반적인 MAS 고유 가치 강화 학습(IVRL) 아키텍처를 제시합니다. 제안된 다중 에이전트 IVRL 행위자-비평가 모델은 StarCraft Multi-Agent Challenge (SMAC) 환경에서 성능 향상을 보이며 그 효용성을 입증합니다. 이는 에이전트들이 공동 목표 달성을 위해 협력하면서 개별 니즈를 충족하고, 집단 효용성과 시스템 비용 간의 균형을 맞추는 데 기여할 수 있음을 시사합니다.