본 논문은 여러 에이전트가 관여하는 새로운 온라인 공정 분배 문제의 변형을 다룬다. 학습자는 공정성과 효율성 제약 조건을 만족시키면서 나눌 수 없는 아이템을 순차적으로 관찰하고, 이를 에이전트 중 하나에 돌이킬 수 없이 할당해야 한다. 기존 알고리즘은 충분히 많은 복사본을 가진 소수의 아이템을 가정하여 모든 아이템-에이전트 쌍에 대한 좋은 유틸리티 추정을 가능하게 한다. 하지만 이 가정은 많은 실제 응용 프로그램에서 성립하지 않을 수 있다. 예를 들어, 많은 사용자(아이템)가 플랫폼 서비스 제공자(에이전트)를 몇 번만 사용하는(소수의 아이템 복사본) 온라인 플랫폼에서는 모든 아이템-에이전트 쌍에 대한 유틸리티를 정확하게 추정하기 어렵다. 이를 해결하기 위해 본 논문에서는 유틸리티가 아이템-에이전트 특징의 알려지지 않은 함수라고 가정한다. 그런 다음 온라인 공정 분배를 상황 밴딧 문제로 모델링하는 알고리즘을 제안하고, 하위 선형 후회 보장을 제공한다. 실험 결과는 제안된 알고리즘의 효과를 추가적으로 검증한다.