본 논문은 막대 차트를 이용한 관계 추론 과제에서 합성곱 신경망(CNN)과 인간의 일반화 성능을 체계적으로 연구한 결과를 제시합니다. 먼저 기존 그래픽 지각 실험들을 재검토하여 CNN의 벤치마크 성능을 업데이트하고, 표준 시각화를 점진적으로 변형하여 막대 길이 비율 추정이라는 고전적인 관계 추론 과제에서 CNN의 일반화 성능을 테스트합니다. 또한 CNN과 인간의 성능을 비교하기 위한 사용자 연구를 수행합니다. 실험 결과, CNN은 훈련 및 테스트 데이터가 동일한 시각적 인코딩을 가질 때만 인간보다 성능이 우수하며, 그렇지 않으면 성능이 저하될 수 있음을 보여줍니다. 또한 CNN은 목표 막대와의 관련성에 관계없이 다양한 시각적 인코딩의 변화에 민감하지만, 인간은 주로 막대 길이에 영향을 받는다는 것을 발견했습니다. 본 연구는 시각화를 이용한 견고한 관계 추론이 CNN에게는 어려운 과제임을 시사하며, CNN의 일반화 성능을 향상시키려면 과제 관련 시각적 특징을 더 잘 인식하도록 훈련해야 할 필요성을 제시합니다.