본 논문은 약물 발견 과정에서 특정 약리적 특성을 가진 화합물을 식별하는 것을 목표로, 기존 대규모 언어 모델(LLM)의 분자 생성 능력의 한계를 극복하기 위해 엔트로피 강화 계획(ERP) 알고리즘을 제안합니다. LLM의 직접적인 디코딩은 잘못된 토큰 사용으로 인한 무효 분자 생성이나 불균형적인 탐색 및 활용으로 인한 비최적 분자 생성을 초래할 수 있다는 점을 지적하며, ERP는 Transformer 디코딩 과정을 개선하여 탐색과 활용 간의 균형을 맞추도록 설계되었습니다. SARS-CoV-2 바이러스(3CLPro)와 인간 암세포 표적 단백질(RTCB)을 대상으로 한 실험에서 기존 최첨단 알고리즘보다 1-5%, 기준 모델보다 5-10% 향상된 성능을 보였으며, 다양한 목적 함수로 훈련된 Transformer 모델에서도 견고한 성능 향상을 보였습니다. 또한, 세 가지 코드 생성 벤치마크에서도 기존 최첨단 알고리즘을 능가하는 결과를 얻었습니다.