LLM 기반 자율 에이전트의 복잡한 다단계 작업 수행 능력 향상을 위해, 행동 경로의 내부 추론 과정(사고)에 대한 안전성 확보가 중요합니다. 본 논문에서는 에이전트의 고위험 사고를 실시간으로 수정하는 플러그인 모듈인 Thought-Aligner를 제안합니다. 경량 모델을 사용하여 각 행동 실행 전에 고위험 사고를 수정하고, 수정된 사고를 에이전트에 다시 입력하여 안전한 후속 결정과 도구 상호 작용을 보장합니다. 10가지 시나리오에 걸친 명령어 데이터셋을 구축하고 대조 학습 기법을 사용하여 모델을 미세 조정했습니다. 실험 결과, Thought-Aligner는 에이전트의 안전성을 평균적으로 50%에서 90%로 향상시키는 동시에, 응답 지연 시간을 100ms 이하로 유지하고 자원 사용량을 최소화했습니다.