본 논문은 기존의 반복적인 단일 단계 예측에 의존하는 컴퓨터 지원 합성 계획(CASP) 방법의 비효율성과 확장성 문제를 해결하기 위해, 트랜스포머 기반의 다중 단계 합성 경로 생성 모델을 제시합니다. 혼합 전문가 접근 방식을 활용하여 여러 단계의 합성 경로를 단일 문자열로 직접 생성하며, 이전 단계의 모든 정보를 바탕으로 각 변환을 조건부로 예측합니다. 특히, DMS Explorer XL 모델은 목표 화합물만 입력으로 받아 PaRoutes 데이터셋에서 기존 최고 성능 모델 대비 n₁ 및 n₅ 테스트 세트에서 Top-1 정확도가 각각 1.9배 및 3.1배 향상되었습니다. 원하는 단계 수와 출발 물질과 같은 추가 정보를 제공하면 모델 크기 감소와 정확도 향상이 가능하며, 예측 과정에 제약 조건을 추가하는 것이 유리함을 보여줍니다. 최고 성능 모델인 DMS-Flex (Duo)는 n₁ 및 n₅ 세트에서 Top-1 및 Top-10 정확도가 25-50% 더 높습니다. 또한, 훈련 데이터에 포함되지 않은 FDA 승인 약물에 대한 경로를 성공적으로 예측하여 강력한 일반화 능력을 입증했습니다. 훈련 세트의 다양성이 제한되어 덜 일반적인 반응 유형에 대한 성능에 영향을 미칠 수 있지만, 다중 단계 우선 접근 방식은 완전 자동화된 역합성 계획을 위한 유망한 방향을 제시합니다.