본 연구에서는 입자 가속기 빔라인 설계를 강화 학습(RL) 문제로 재구성하는 Python 기반 라이브러리인 RLABC (Reinforcement Learning for Accelerator Beamline Control)를 소개합니다. Elegant 시뮬레이션 프레임워크를 활용하여, RLABC는 표준 격자 및 요소 입력 파일로부터 RL 환경을 자동 생성하여 자석의 순차적 조정을 통해 입자 손실을 최소화합니다. 빔 통계 정보를 캡처하는 포괄적인 상태 표현, 자석 매개변수를 조정하기 위한 액션, 전송 효율성에 초점을 맞춘 보상 함수를 정의합니다. Deep Deterministic Policy Gradient (DDPG) 알고리즘을 사용하여, 두 개의 빔라인에서 RLABC의 효과를 입증했으며, 전문가 수동 최적화와 유사한 94% 및 91%의 전송률을 달성했습니다.