본 논문은 Edge, Cloud, HPC 환경을 아우르는 과학적 데이터 처리 워크플로우에서 생성되는 방대한 양의 provenance 데이터 분석을 위한 새로운 접근법을 제시한다. 기존의 방식들이 커스텀 스크립트, 구조화된 질의어, 정적 대시보드에 의존하여 데이터 상호작용에 제약이 있는 점을 개선하기 위해, 본 논문에서는 대화형 LLM(Large Language Model) 에이전트를 활용한 런타임 데이터 분석 방법론, 참조 아키텍처, 오픈소스 구현을 제안한다. 경량의 메타데이터 기반 설계를 통해 자연어를 구조화된 provenance 질의로 변환하고, LLaMA, GPT, Gemini, Claude 등 다양한 LLM을 사용한 실제 화학 워크플로우 평가를 통해 모듈형 설계, 프롬프트 튜닝, RAG(Retrieval-Augmented Generation)가 기록된 provenance을 넘어 정확하고 통찰력 있는 응답을 가능하게 함을 보여준다.