[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Achieving Scalable Robot Autonomy via neurosymbolic planning using lightweight local LLM

Created by
  • Haebom

저자

Nicholas Attolino, Alessio Capitanelli, Fulvio Mastrogiovanni

개요

본 논문은 로봇 자율성에 필수적인 PDDL 기반 상징적 작업 계획이 동적 인간-로봇 협업에서는 확장성, 재계획 요구, 계획 가용성 지연 문제로 어려움을 겪는다는 점을 지적합니다. 기존 신경상징 프레임워크는 GPT-3와 같은 거대 언어 모델(LLM)을 활용했지만, 폐쇄형 원격 모델 의존으로 인해 제3자 종속성, 불일치 응답 시간, 제한된 계획 길이 및 복잡성, 다중 도메인 확장성 문제 등의 제약이 있었습니다. 본 논문에서는 Gideon이라는 새로운 프레임워크를 제시하는데, 이는 더 작고 지역적인 LLM을 사용하여 확장된 문맥 길이를 제공합니다. Gideon은 모든 도메인에 대해 현실적인 도메인-문제-계획 튜플의 대규모 데이터셋을 체계적으로 생성하는 새로운 문제 생성기를 통합하고, 지역 LLM에 신경상징적 계획을 적용하여 온디바이스 실행과 다중 도메인 지원을 위한 확장된 문맥을 가능하게 합니다. 단일 도메인 시나리오에서 Qwen-2.5 1.5B를 사용한 예비 실험 결과, 32k 샘플로 66.1%의 유효 계획 비율을 달성했으며, 더 많은 데이터를 통해 이 비율을 높일 수 있음을 보여줍니다. 16k 샘플을 사용한 다중 도메인 테스트에서는 70.6%의 더 높은 계획 유효성 비율을 달성하여 도메인 간 확장성과 데이터 다양성이 학습 효율에 긍정적 영향을 미침을 증명했습니다. 긴 수평선 계획과 축소된 모델 크기로 인해 Gideon의 훈련은 대형 LLM 기반 기준 모델보다 훨씬 비효율적이지만, 훈련된 모델이 기준 모델보다 약 120배 작고 추론 효율성, 확장성, 다중 도메인 적응성 측면에서 상당한 이점을 얻을 수 있다는 점을 고려할 때 여전히 중요한 결과입니다. Gideon의 간소화된 데이터 생성 파이프라인을 통해 훈련 비효율성을 완화할 수 있습니다.

시사점, 한계점

시사점:
지역 LLM을 활용하여 로봇 계획의 확장성, 재계획, 지연 문제를 해결하는 새로운 프레임워크(Gideon) 제시.
온디바이스 실행 및 다중 도메인 지원을 위한 확장된 문맥 제공.
대규모 현실적 데이터셋을 체계적으로 생성하는 문제 생성기 개발.
상대적으로 작은 LLM (Qwen-2.5 1.5B)을 사용하여 높은 계획 유효성(66.1%~70.6%) 달성.
다중 도메인 적응성 및 데이터 다양성의 긍정적 효과 입증.
기존 대형 LLM 기반 모델 대비 추론 효율성, 확장성, 다중 도메인 적응성 향상.
한계점:
대형 LLM 기반 모델보다 훈련 효율성이 낮음.
실험은 단일 및 다중 도메인 시나리오에 대한 예비 실험 결과이며, 더욱 광범위한 실험이 필요함.
긴 수평선 계획에 대한 성능 평가가 추가적으로 필요함.
👍