본 논문은 대규모 데이터에서의 인과 추론(Causal Discovery, CD)의 확장성 문제를 해결하기 위해 대규모 언어 모델(LLM)을 활용하는 새로운 프레임워크를 제시합니다. 기존의 pairwise query 방식 대신 폭우선탐색(Breadth-First Search, BFS) 전략을 채택하여 필요한 질의 수를 변수 개수에 대해 선형적으로 줄임으로써 확장성을 크게 향상시켰습니다. 능동학습(Active Learning, AL)과 동적 점수 매커니즘을 활용하여 상호 정보, 부분 상관, LLM 신뢰도 점수를 결합하여 인과 그래프를 효율적이고 정확하게 추론합니다. 또한, 추론된 인과 그래프에 대한 공정성 분석을 수행하여 민감 속성의 직접 및 간접 효과를 파악하고, 기존 방법과 비교하여 정확한 인과 그래프 구성의 중요성을 강조합니다.