Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Curiosity-Diffuser: Curiosity Guide Diffusion Models for Reliability

Created by
  • Haebom
Category
Empty

저자

Zihao Liu, Xing Liu, Yizhai Zhang, Zhengxiong Liu, Panfeng Huang

개요

본 논문은 신경망 기반 모방 정책의 불안정성으로 인한 로봇 지능의 한계를 해결하기 위해, Curiosity-Diffuser라는 새로운 방법을 제안합니다. 이는 Random Network Distillation (RND) 기반의 curiosity module을 사용하여 모델의 행동이 훈련 데이터와 얼마나 일치하는지 평가하고, classifier guidance diffusion을 통해 curiosity를 최소화하여 추론 중 과적합을 줄이는 것을 목표로 합니다. 또한, 생성된 행동과 훈련 데이터셋 간의 유사성을 측정하는 계산 효율적인 신뢰성 평가 지표를 제안합니다. 시뮬레이션 결과, Curiosity-Diffuser가 다양한 시나리오에서 작업 성능을 향상시키고 훈련 데이터와 더 유사한 행동을 생성하는 것을 보여줍니다. 소스 코드는 github.com/CarlDegio/Curiosity-Diffuser에서 확인할 수 있습니다.

시사점, 한계점

시사점:
신경망 기반 로봇 제어의 안정성 및 신뢰성 향상에 기여할 수 있습니다.
RND와 classifier guidance diffusion을 결합하여 curiosity를 효과적으로 제어하는 새로운 방법을 제시합니다.
계산 효율적인 정책 신뢰성 평가 지표를 제공합니다.
다양한 시나리오에서의 효과적인 성능 향상을 실험적으로 검증합니다.
한계점:
현재는 시뮬레이션 환경에서만 검증되었으며, 실제 로봇 시스템에 적용하기 위한 추가적인 연구가 필요합니다.
제안된 신뢰성 평가 지표의 일반성 및 한계에 대한 추가적인 분석이 필요합니다.
다양한 유형의 환경 및 작업에 대한 일반화 성능 평가가 더 필요합니다.
👍