Order-Preserving (OP) GFlowNets은 확률적 최적화 기법을 사용하여 복잡한 다중 목표(MOO) 블랙박스 최적화 문제를 해결하는 데 놀라운 성공을 거두었습니다. 특히, 파레토 프런트 근처의 다양한 후보를 효율적으로 샘플링하도록 온라인으로 훈련될 수 있습니다. OP GFlowNets의 주요 장점은 파레토 우세를 기반으로 훈련 샘플에 대한 지역적 순서를 부과하여 선호도 조건부 GFlowNets와 같은 다른 접근 방식에서 일반적으로 필요한 스칼라화를 없앨 수 있다는 것입니다. 그러나 우리는 OP GFlowNets의 중요한 한계를 확인했습니다. 훈련 샘플에 지역적 순서를 부과하면 상충되는 최적화 목표로 이어질 수 있습니다. 이 문제를 해결하기 위해, 우리는 지역적 순서를 전역적 순서로 변환하여 이러한 충돌을 해결하는 Global-Order GFlowNets를 제안합니다. 다양한 벤치마크에 대한 실험 평가는 제안된 방법의 효능과 가능성을 보여줍니다.