본 논문은 현대 머신러닝의 핵심 과제인 구성적 일반화(compositional generalization)를 위한 새로운 평가 프레임워크와 모델을 제시합니다. 기존 벤치마크의 한계점을 극복하고, 계산 효율성을 높이는 동시에 엄격한 평가를 가능하게 합니다. 또한, 5000개 이상의 모델 학습을 통해 지도 학습 기반 비전 백본의 구성적 일반화 능력을 평가하고, Attribute Invariant Networks라는 새로운 모델을 제안하여 기존 모델 대비 향상된 성능을 보입니다.