Chaos Engineering (CE)은 분산 시스템의 복원력을 향상시키기 위한 엔지니어링 기법입니다. 시스템에 의도적으로 결함을 주입하여 복원력을 테스트하고, 취약점을 찾아내어 프로덕션 환경에서 장애를 일으키기 전에 해결합니다. 이 논문은 이러한 CE 주기를 자동화하여 누구나 저렴한 비용으로 복원력 있는 시스템을 구축할 수 있도록 돕는 시스템인 ChaosEater를 제안합니다. ChaosEater는 대규모 언어 모델(LLM)을 사용하여 CE 주기의 모든 단계를 자동화하며, 특히 Kubernetes 기반 시스템을 대상으로 합니다.