본 논문은 특정 작업 로직을 따르는 언어 모델 기반 대화 에이전트를 훈련하기 위한 효과적인 데이터 생성 방법을 제안합니다. 기존 데이터 시뮬레이션 방법들이 발화 수준에서 언어, 주제 또는 대화 행위의 다양성 증가에 집중한 것과 달리, 본 논문은 대화 수준에서 작업 로직 다양성이라는 중요한 측면에 초점을 맞춥니다. LLM을 사용하여 의사결정 트리 구조의 작업 계획을 생성하고, 이를 통해 주어진 작업에 대한 다양한 대화 경로(dialogue flow)를 도출하는 새로운 데이터 시뮬레이션 방법을 제시합니다. 각 대화 경로는 고유한 경로를 따르는 다회전 대화 생성을 안내하며, 15개의 서로 다른 도메인에 걸쳐 3,886개의 대화 경로로 구성된 작업 지향적 대화 데이터셋을 생성합니다. 다음 행동 예측 작업을 사용하여 생성된 데이터셋의 효과를 검증하며, 해당 데이터셋으로 미세 조정된 모델이 GPT-4를 포함한 강력한 기준 모델보다 우수한 성능을 보임을 확인합니다. 논문이 수락되면 코드와 데이터를 공개할 계획입니다.