본 논문은 기초 모델의 학습 과정을 데이터 압축 관점에서 재해석하여 저작권 문제를 새롭게 조명합니다. 기존의 재구성 오류 최소화 방식으로 학습된 기초 모델은 훈련 데이터를 암기하고 재현할 수 있으며, 이는 모델의 가중치가 훈련 데이터의 압축된 표현이라는 것을 시사합니다. 따라서 저작권 관점에서 모델의 가중치는 저작물의 복제 또는 파생 저작물로 간주될 수 있습니다. 본 논문은 이러한 관점에서 발생하는 기술적, 법적 문제점들을 분석하고, 정보 중심적 접근 방식이 이러한 복잡한 법적 문제를 해결하는 유망한 방식임을 제시합니다.