딥러닝 기반 분자 생성 모델은 유망한 약물 후보를 생성하여 방대한 화학 공간을 효율적으로 탐색할 수 있는 잠재력을 보여주었지만, 화학적으로 유효하지 않은 분자를 생성하는 경우가 많아 활용 가능한 화학 공간을 제한하고 실제 적용에 어려움을 겪고 있다. 이 문제를 해결하기 위해, 본 논문에서는 유효하지 않은 분자를 유효한 분자로 수정하는 ChemFixer 프레임워크를 제안한다. ChemFixer는 트랜스포머 아키텍처를 기반으로 하며, 마스킹 기법을 사용하여 사전 훈련되었고, 유효/무효 분자 쌍의 대규모 데이터 세트로 미세 조정되었다. 다양한 생성 모델에 대한 포괄적인 평가를 통해 ChemFixer는 분자 유효성을 향상시키면서도 원래 출력의 화학적 및 생물학적 분포 특성을 효과적으로 유지했다. 또한, ChemFixer는 제한된 데이터를 사용한 약물-표적 상호 작용(DTI) 예측 작업에 효과적으로 적용되어 생성된 리간드의 유효성을 향상시키고 유망한 리간드-단백질 쌍을 발견했다. ChemFixer는 딥러닝 기반의 약물 발견의 다양한 단계에서 분자 유효성을 향상시키고 접근 가능한 화학 공간을 확장하는 실용적인 도구로서의 가능성을 보여준다.