자율주행차(AV)와 같은 AI 시스템의 신뢰성과 안전성은 훈련 및 테스트에 사용되는 데이터셋의 대표성에 달려 있습니다. 본 논문은 훈련 및 테스트에 사용되는 시나리오 기반 데이터가 시스템이 안전하게 작동하도록 설계된 Operational Design Domain (ODD) 또는 예상되는 Target Operational Domain (TOD)을 얼마나 잘 반영하는지, 즉 대표성에 초점을 맞춥니다. 제한된 데이터를 처리하고 불확실성을 고려하기 위해, TOD의 분포를 추정하고 불확실성을 고려하는 확률적 방법을 제안합니다. 이 방법은 불확실성을 고려한 대표성 추정값을 단일 값이 아닌 구간 값으로 제공합니다. 날씨, 도로 유형, 시간대 등 운영 범주에 걸쳐 시나리오 스위트와 추론된 TOD의 분포를 비교하는 수치적 예시를 제시하고, 종속성과 사전 불확실성을 고려하여 지역적 및 전역적으로 대표성을 구간으로 추정합니다.