Bài báo này trình bày nghiên cứu nhằm xác định các lỗ hổng, sai lệch và thành phần độc hại trong chuỗi cung ứng của các mô hình ngôn ngữ quy mô lớn (LLM), cải thiện tính công bằng của mô hình và đảm bảo tuân thủ các khuôn khổ quy định. Do các LLM hiện tại chắc chắn sẽ giải quyết những vấn đề này do phụ thuộc vào các mô hình cơ sở, mô hình được đào tạo trước và các tập dữ liệu bên ngoài, chúng tôi nghiên cứu chuỗi cung ứng LLM, tập trung vào mối quan hệ giữa các mô hình và tập dữ liệu. Để đạt được mục tiêu này, chúng tôi thiết kế một phương pháp để thu thập thông tin chuỗi cung ứng LLM một cách có hệ thống và xây dựng một đồ thị dị biệt có hướng mới (402.654 nút và 462.524 cạnh) biểu diễn mối quan hệ giữa các mô hình và tập dữ liệu. Đồ thị này sau đó được sử dụng để thực hiện nhiều phân tích khác nhau và mang lại một số kết quả thú vị.