본 논문은 부분적으로 관측 가능한 확률적 게임(POSG)에서 경쟁적인 정보 수집 행동을 가능하게 하는 유한한 기록/지평 개선을 제시합니다. 완전 연속 POSG에서의 계획은 오프라인 계산이나 각 플레이어가 유지하는 신념의 순서에 대한 가정 없이는 다루기 어렵다는 점을 고려하여, 궤적 공간에서 경쟁적인 정보 수집 행동을 허용하는 POSG의 유한 기록/지평 개선을 공식화합니다. 그리고 일련의 근사를 통해, 공동 상태 공간의 입자 기반 추정을 활용하고 확률적 경사 하강법을 수행하는 이러한 게임에서 합리적인 궤적 계획을 계산하는 온라인 방법을 제시합니다. 또한 이 방법을 개별 에이전트에 배포하는 데 필요한 조정 사항을 제공합니다. 연속 추적 회피 및 창고 물품 수집 시나리오(N>2 플레이어 및 시각적 및 물리적 장애물이 있는 더 복잡한 환경으로의 확장 포함)에서 이 방법을 테스트하여 능동적 정보 수집의 증거를 보여주고 수동 경쟁자보다 성능이 우수함을 입증합니다.