본 논문은 세포 재프로그래밍 전략을 발견하는 데 있어 기존의 실험적 접근 방식의 한계를 극복하기 위해 심층 강화 학습(DRL)을 활용하는 새로운 방법을 제시합니다. 특히, 비동기 업데이트 모드 하에서 부울 네트워크 모델(유전자 조절 네트워크 및 신호 전달 경로 네트워크 등)을 제어하는 문제를 공식화하고, 확장성을 높이기 위해 의사-인력자(pseudo-attractor) 개념과 그 효율적인 식별 절차를 개선했습니다. 또한, 생물학적 시스템의 구조를 활용하기 위해 그래프 신경망(GNN)을 DRL 에이전트가 학습하는 행동-가치 함수의 인공 신경망 근사기에 통합했습니다. 실제 생물학적 네트워크에 대한 실험을 통해 접근 방식의 확장성과 효과성을 입증했습니다.