Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Distilling On-device Language Models for Robot Planning with Minimal Human Intervention

Created by
  • Haebom

저자

Zachary Ravichandran, Ignacio Hounie, Fernando Cladera, Alejandro Ribeiro, George J. Pappas, Vijay Kumar

개요

본 논문은 대규모 언어 모델(LLM)을 활용하는 로봇 플래너가 통신 환경이 불안정한 환경에서 사용하기 어렵다는 점을 해결하기 위해, 소규모 언어 모델(SLM)을 로봇에 탑재하는 프레임워크인 PRISM을 제안한다. PRISM은 기존 LLM 기반 플래너를 활용하여 자동적으로 다양한 작업과 환경을 합성하고, LLM으로부터 계획을 추출하여 생성된 합성 데이터를 기반으로 SLM을 훈련시킨다. PRISM을 통해 Llama-3.2-3B의 성능을 GPT-4o의 93% 수준까지 향상시켰으며, 다양한 로봇 플랫폼과 환경에서 일반화 성능을 보였다.

시사점, 한계점

시사점:
PRISM은 LLM을 활용하는 로봇 플래너의 온디바이스 구현을 가능하게 하여 통신 제약 환경에서의 활용성을 높였다.
PRISM은 합성 데이터를 사용하여 SLM을 훈련함으로써, 실제 데이터 수집의 어려움을 극복하고 효율적인 학습을 가능하게 했다.
PRISM은 다양한 로봇 플랫폼과 환경에서 일반화 성능을 보여, 범용적인 적용 가능성을 입증했다.
한계점:
PRISM의 성능은 LLM 기반 플래너의 성능에 의존적이며, LLM의 성능에 따라 SLM의 성능도 제한될 수 있다.
PRISM이 생성하는 합성 데이터의 품질이 SLM의 성능에 영향을 미칠 수 있으며, 합성 데이터의 품질 관리 방안에 대한 연구가 필요하다.
PRISM이 실제 환경에서의 로봇 동작에 미치는 영향에 대한 추가적인 검증이 필요하다.
👍