오픈소스 머신러닝(ML) 데이터셋과 모델의 빠른 채택으로 인해 데이터 포이즈닝 및 ML 수명주기 전반에 걸친 공급망 공격과 같은 심각한 위험에 AI 애플리케이션이 노출됩니다. 규제 압력이 증가함에 따라 투명성을 높여 이러한 문제를 해결해야 하는 ML 모델 공급업체는 데이터 및 지적 재산권 보호 요구 사항과의 균형을 맞추는 데 어려움을 겪습니다. 본 논문에서는 완전히 증명 가능한 ML 파이프라인을 가능하게 하는 프레임워크인 Atlas를 제안합니다. Atlas는 데이터 및 소프트웨어 공급망 출처에 대한 오픈 사양을 활용하여 모델 아티팩트의 진위성과 엔드투엔드 계보 메타데이터에 대한 검증 가능한 레코드를 수집합니다. Atlas는 신뢰할 수 있는 하드웨어와 투명성 로그를 결합하여 메타데이터 무결성을 강화하고, 데이터 기밀성을 유지하며, 교육부터 배포까지 ML 파이프라인 작업 중 무단 액세스를 제한합니다. Atlas의 프로토타입 구현은 여러 오픈소스 도구를 통합하여 ML 수명주기 투명성 시스템을 구축하고 두 가지 사례 연구 ML 파이프라인을 통해 Atlas의 실용성을 평가합니다.