본 논문은 세포 재프로그래밍 전략 발견의 효율성을 높이기 위해 심층 강화 학습 기반의 새로운 계산 프레임워크를 제시합니다. 기존의 실험적 접근의 시간 및 비용 문제를 해결하고자, 비동기 업데이트 모드 하에서 BN 및 PBN 프레임워크 내 세포 재프로그래밍을 제어 문제로 공식화합니다. 또한, 의사-끌개(pseudo-attractor) 개념을 도입하고 훈련 중 의사-끌개 상태를 식별하는 절차를 제시하며, 다양한 모델에서 이 계산 프레임워크를 테스트합니다.