본 논문은 합성생물학, 유전자 치료, 정밀의학의 발전에 필수적인, 세포 유형 특이적 유전자 발현을 정확하게 달성하는 조절 DNA 서열 설계에 관한 연구이다. Transformer 기반 언어 모델이 조절 DNA의 패턴을 효과적으로 포착할 수 있지만, 생성적 접근 방식은 신뢰할 수 있는 세포 특이적 활성을 가진 새로운 서열을 생성하는 데 어려움을 겪는다. 본 연구는 제어 가능한 세포 유형 특이성을 가진 조절 DNA 서열을 설계하기 위해 고안된 새로운 제약 강화 학습(RL) 프레임워크인 Ctrl-DNA를 소개한다. 생물학적으로 정보에 입각한 제약 최적화 문제로 조절 서열 설계를 공식화함으로써, RL을 자기 회귀 유전체 언어 모델에 적용하여 모델이 표적 세포 유형에서 조절 활성을 극대화하면서 표적 이외의 영향을 제한하는 서열을 반복적으로 개선할 수 있도록 한다. 인간 프로모터 및 엔핸서에 대한 평가 결과, Ctrl-DNA는 기존의 생성적 및 RL 기반 접근 방식을 능가하여 고적합성 조절 서열을 생성하고 최첨단 세포 유형 특이성을 달성함을 보여준다. 또한, Ctrl-DNA가 생성한 서열은 핵심 세포 유형 특이적 전사 인자 결합 부위(TFBS)를 포착하여 생성된 서열의 생물학적 타당성을 입증한다.