본 논문은 네트워크 과학 및 머신러닝 분야에서 중요한 문제인 링크 예측(Link Prediction, LP) 방법의 평가에 대한 기존 연구의 한계를 지적하고, 보다 엄격하고 통제된 실험 설정을 제안합니다. 기존 연구들이 네트워크 유형, 문제 유형, 노드 간 지오데식 거리, LP 방법의 특성 및 적용 가능성, 클래스 불균형 등 다양한 요소들을 고려하지 않고 균일한 설정에서 평가되었던 점을 문제 삼습니다. 본 논문에서는 이러한 요소들을 고려한 실험 설정을 제시하고, 다양한 실제 네트워크 데이터셋을 사용하여 광범위한 실험을 수행합니다. 실험 결과를 바탕으로 LP 방법의 성능에 영향을 미치는 요소들의 상호작용에 대한 통찰력을 제공하고, LP 방법 평가를 위한 모범 사례를 제시합니다.