Sign In

CCDP: Composition of Conditional Diffusion Policies with Guided Sampling

Created by
  • Haebom
Category
Empty

저자

Amirreza Razmjoo, Sylvain Calinon, Michael Gienger, Fan Zhang

개요

이 논문은 명시적인 모델, 시뮬레이션 또는 상세한 작업 정의 없이 데이터를 직접 학습하는 유망한 접근 방식인 모방 학습에 대해 설명합니다. 특히, 이 논문은 실패한 동작을 피하기 위해 샘플링 분포를 개선하는 향상된 샘플링 전략을 제안합니다. 성공적인 시연 데이터만 사용하여 추가적인 탐색 동작이나 상위 수준 컨트롤러 없이 복구 동작을 추론할 수 있습니다. 또한, 긴 수평선 이력을 필요로 하는 실패 관리를 위해 확산 모델 분해를 활용하여 학습, 데이터 수집 및 추론에서 여러 개의 작고 관리 가능한 하위 문제로 분할합니다. 이 방법은 이전 샘플이 실패할 경우 효율성을 향상시키기 위해 동적으로 샘플링 공간을 조정하는 하위 수준 컨트롤러를 제공합니다.

시사점, 한계점

시사점:
성공적인 시연 데이터만으로 복구 동작을 추론할 수 있습니다.
확산 모델 분해를 통해 실패를 관리하고 시스템의 적응성을 높입니다.
동적으로 샘플링 공간을 조정하여 효율성을 향상시키는 하위 수준 컨트롤러를 제공합니다.
문 방향, 물체 조작, 버튼 찾기 등 다양한 작업에서 기존 기준보다 뛰어난 성능을 보입니다.
한계점:
논문에 구체적인 한계점은 명시되어 있지 않음.
👍