다수의 에이전트가 학습 기반의 수요 측면 의료 종사자 환경에서 목표를 달성하기 위해 공정한 작업량 할당을 하는 것이 중요합니다. 기존의 MARL (Multi-Agent Reinforcement Learning) 접근 방식은 사후 조정 (post hoc orchestration)을 통해 보상을 형성하여 공정성을 유도하지만, 런타임에서 개별 에이전트가 변경할 수 없는 인증 가능한 자체 시행 가능한 공정성은 제공하지 않습니다. 본 논문에서는 각 에이전트가 다른 에이전트와 자원을 공유하는 환경에서, 개별 행동이 다른 에이전트의 행동에 영향을 미치는 자체 이익 추구 의사 결정자 간의 학습 기반 최적화 방식을 제시합니다. 이는 문제를 GNE (Generalized Nash Equilibrium) 게임 이론적 프레임워크로 확장하여, 그룹 정책을 안전하고 지역적으로 효율적인 평형으로 유도하여 어떤 에이전트도 일방적으로 결정을 변경하여 효용 함수를 개선할 수 없도록 합니다. Fair-GNE는 MARL을 제약된 GNE 탐색 게임으로 모델링하여 문제의 자연스러운 구조 내에서 이상적인 공정한 집단 평형을 규정합니다. 논문에서는 맞춤 설계된 고충실도 소생 시뮬레이터에서 가설을 엄격하게 평가했습니다. 모든 수치 실험에서 Fair-GNE는 고정 페널티 기준선 (0.89 vs. 0.33 JFI, $p < 0.01$)에 비해 작업량 균형에서 유의미한 개선을 달성했으며, 86%의 작업 성공률을 유지하며 적응형 제약 조건 시행을 통해 통계적으로 유의미한 공정성 향상을 보여주었습니다.