LEMMA-RCA는 복잡한 시스템의 신뢰성과 성능 향상에 필수적인 근본 원인 분석(RCA)을 위한 대규모 오픈소스 데이터셋입니다. IT 및 OT 운영 시스템(마이크로서비스, 상수도 분배 및 처리 시스템 등)의 다양한 실제 장애 시나리오를 포함하며, 수백 개의 시스템 엔티티가 포함되어 있습니다. 다양한 RCA 작업(오프라인 및 온라인 모드, 단일 및 다중 모달리티 포함)에 대한 8가지 기준 방법의 성능을 평가하여 데이터셋의 고품질을 입증했습니다. 데이터셋은 https://lemma-rca.github.io/ 에서 공개적으로 이용 가능합니다.