본 논문은 리튬이온 배터리 충전 시 셀 간 충전량 불균형 문제를 해결하기 위해 심층 강화 학습(Deep Reinforcement Learning, DRL) 기반의 안전한 배터리 충전 제어 방법을 제안합니다. 기존 방법들의 안전성과 충전 시간 간의 상충 관계 및 배터리 특정 조건에 대한 의존성 문제를 해결하고자, DRL 에이전트에 안전 계층(safety-layer)을 추가하여 안전 위험 상태를 회피하도록 에이전트의 행동을 수정하는 방식을 제시합니다. 이를 통해 다양한 배터리 구성에도 효과적으로 적용 가능한 일반화된 정책 학습을 목표로 합니다. 실험 결과, 안전 계층 기반의 행동 수정이 안전 위반을 줄이고 다양한 배터리 구성에 대해 견고한 정책 학습을 가능하게 함을 보여줍니다.