본 논문은 자연어 설명으로 정의되는 복잡한 시계열 이벤트 탐지 문제를 해결하기 위해 새로운 언어 기반 시계열 이벤트 탐지(Language-guided TSED) 설정을 제안합니다. 이를 위해 언어 설명을 신호 원시 요소에 대한 구조화된 시간 논리로 변환하는 Event Logic Tree(ELT)라는 지식 표현 프레임워크를 개발하고, 이를 기반으로 시각화된 신호에서 원시 요소를 반복적으로 파악하고 ELT 제약 조건 하에서 합성하는 신경-기호 VLM 에이전트 프레임워크인 SELA를 제시합니다. SELA는 이벤트 구간뿐만 아니라 충실한 트리 구조의 설명도 생성하며, 실제 에너지 및 기후 도메인에서의 실험을 통해 기존 지도 학습 및 제로/퓨샷 시계열 추론 방법보다 우수한 성능을 입증했습니다.