본 논문은 분자 생성 모델링 분야에서 높은 정확도와 효율성을 달성하는 2단계 생성 프레임워크인 Graph VQ-Transformer (GVT)를 소개합니다. 핵심은 분자 그래프를 고품질 이산 잠재 시퀀스로 압축하는 Graph Vector Quantized Variational Autoencoder (VQ-VAE)입니다. Graph Transformer, Reverse Cuthill-McKee (RCM) 노드 순서 지정 및 Rotary Positional Embeddings (RoPE)를 결합하여 VQ-VAE는 완벽에 가까운 재구성을 달성합니다. 이후, 자기회귀 Transformer가 이러한 이산 잠재 변수들에 대해 훈련되어 그래프 생성을 잘 구조화된 시퀀스 모델링 문제로 변환합니다. GVT는 복잡한 그래프를 고품질 이산 시퀀스로 매핑하여 대규모 언어 모델(LLM)과의 잠재적 시너지 효과를 열어줍니다. GVT는 ZINC250k, MOSES, GuacaMol과 같은 주요 벤치마크에서 우수한 성능을 보이며, FCD 및 KL 발산과 같은 주요 분포 유사성 메트릭에서 선도적인 확산 모델을 능가합니다.