본 논문은 관측 데이터로부터 인과 그래프 모델의 구조를 복구하는 과정이 과학적 시나리오에서 인과적 발견에 필수적이지만 어려운 과제임을 다룹니다. 기존의 도메인 특정 인과 발견은 전문가 검증이나 사전 분석에 의존하여 신뢰성을 높이지만, 전문가 자원의 부족으로 한계가 있습니다. 본 논문은 대규모 언어 모델(LLM)을 활용하여 데이터 기반 구조 학습을 안내하는 자율적인 전문가 역할을 수행할 수 있는 잠재력을 제시합니다. 하지만 LLM 기반 추론의 부정확성으로 인해 LLM을 인과 발견에 통합하는 데 어려움이 있습니다. 이를 해결하기 위해 오류 허용 LLM 기반 인과 발견 프레임워크를 제안합니다. 오류 허용 메커니즘은 잠재적 부정확성을 충분히 고려하여 세 가지 측면으로 설계되었습니다. LLM 기반 추론 과정에서 정확도 중심 프롬프팅 전략은 인과 분석을 신뢰할 수 있는 범위로 제한합니다. 다음으로, 지식-구조 전환은 LLM에서 도출된 인과적 진술을 구조적 인과적 상호 작용과 정렬합니다. 구조 학습 과정에서 데이터에 대한 적합도와 LLM에서 도출된 사전 정보의 준수를 균형 있게 고려하여 사전 정보의 부정확성을 해결합니다. 8개의 실제 인과 구조에 대한 평가는 제안된 LLM 기반 접근 방식이 데이터 기반 인과 발견을 개선하고 부정확한 LLM 기반 사전 정보에 대한 강건성을 보여줍니다. 코드는 https://github.com/tyMadara/LLM-CD 에서 확인할 수 있습니다.
시사점: LLM을 활용한 오류 허용 인과 발견 프레임워크를 제시하여 데이터 기반 인과 발견의 정확도와 효율성을 향상시켰습니다. 실제 데이터셋을 통해 제안된 방법의 효과와 강건성을 검증했습니다.
•
한계점: 제안된 프레임워크의 성능은 LLM의 성능에 의존적이며, LLM의 부정확한 추론으로 인해 여전히 오류가 발생할 가능성이 있습니다. 다양한 도메인과 복잡한 인과 구조에 대한 일반화 성능에 대한 추가 연구가 필요합니다. 사용된 LLM의 종류와 크기에 따라 성능 차이가 발생할 수 있습니다.