Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Retrosynthesis Planning via Worst-path Policy Optimisation in Tree-structured MDPs

Created by
  • Haebom
Category
Empty

저자

Mianchu Wang, Giovanni Montana

개요

본 논문은 목표 분자를 구매 가능한 빌딩 블록으로 분해하는 역합성 계획 문제를 다룬다. 기존 방법의 취약점인 '가장 취약한 고리' 문제를 해결하기 위해, 역합성을 트리 구조의 마르코프 의사 결정 프로세스(MDP) 내에서의 최악 경로 최적화 문제로 재정의한다. 이 새로운 접근 방식을 통해, 단조로운 개선을 보장하는 고유한 최적 해를 갖는다. 저자들은 트리 MDP와 상호 작용하고, 최악의 경로 결과에 대한 가치 함수를 학습하며, 자체 모방을 통해 정책을 개선하는 Interactive Retrosynthesis Planning (InterRetro)를 제안한다. InterRetro는 Retro*-190 벤치마크에서 100%의 성공률을 달성하고, 합성 경로를 단축시키며, 적은 양의 훈련 데이터를 사용하여 유망한 성능을 보인다.

시사점, 한계점

시사점:
역합성 계획을 최악 경로 최적화 문제로 재정의하여 기존 방법의 취약점을 해결.
InterRetro를 통해 Retro*-190 벤치마크에서 최고 성능 달성.
합성 경로를 단축하고, 적은 양의 훈련 데이터로도 우수한 성능을 보임.
트리 MDP와 상호 작용하고 자체 모방을 통해 학습하는 새로운 방법론 제시.
한계점:
논문에서 구체적인 한계점에 대한 언급은 없음.
👍