본 논문은 대규모 언어 모델(LLM)의 공급망에 존재하는 취약성, 편향, 악의적인 구성 요소를 식별하고 모델의 공정성을 개선하며 규제 프레임워크 준수를 보장하기 위한 연구를 제시한다. 기존 LLM은 기본 모델이나 사전 훈련된 모델 및 외부 데이터셋을 사용하기 때문에 이러한 문제를 피할 수 없다는 점에 착안하여, 모델과 데이터셋 간의 관계를 중심으로 LLM 공급망을 연구한다. 이를 위해 LLM 공급망 정보를 체계적으로 수집하는 방법론을 설계하고, 모델과 데이터셋 간의 관계를 나타내는 새로운 유향 이종 그래프(402,654개 노드와 462,524개 에지)를 구축하여 다양한 분석을 수행하고 여러 가지 흥미로운 결과를 도출한다.