본 논문은 분산된 클라이언트의 정보를 이용한 협업 머신러닝 모델 훈련을 가능하게 하는 연합 학습(Federated Learning, FL)에서의 데이터 이질성(non-IID) 문제를 다룹니다. 특히, 기존 연구에서 체계적으로 다뤄지지 않았던 다양한 유형의 데이터 이질성(레이블, 특징, 데이터 양, 시공간적 비대칭)의 영향을 헬링거 거리(Hellinger Distance, HD)를 사용하여 정량적으로 분석합니다. 실제 환경과 유사한 통제된 조건 하에서 네 가지 최신의 non-IID 데이터 처리 전략을 벤치마킹하고, 특히 시공간적 비대칭(spatiotemporal skew) 효과에 대한 최초의 포괄적인 분석을 제공합니다. 분석 결과, 레이블과 시공간적 비대칭 non-IID 유형이 FL 모델 성능에 큰 영향을 미치며, 특정 HD 임계값을 넘어서면 성능 저하가 두드러짐을 보여줍니다. 극단적인 non-IID일 때 FL 성능이 크게 저하되며, 이를 효과적으로 해결하기 위한 FL 연구에 대한 권고를 제시합니다.