[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Achieving Scalable Robot Autonomy via neurosymbolic planning using lightweight local LLM

Created by
  • Haebom

저자

Nicholas Attolino, Alessio Capitanelli, Fulvio Mastrogiovanni

개요

본 논문은 로봇 자율성에 필수적인 PDDL 기반 심볼릭 작업 계획이 동적인 인간-로봇 협업에서는 확장성, 재계획 요구, 지연된 계획 가용성 문제로 어려움을 겪는다는 점을 지적합니다. 기존의 신경기호 프레임워크는 GPT-3와 같은 대규모 언어 모델(LLM)을 활용하여 이러한 문제를 해결하려 했지만, 폐쇄형 원격 모델에 대한 의존으로 인해 제삼자 의존성, 불일치 응답 시간, 제한된 계획 길이 및 복잡성, 다영역 확장성 문제와 같은 중요한 제약이 있었습니다. 본 논문에서는 확장된 컨텍스트 길이를 가진 현대적이고 소규모의 로컬 LLM으로 전환을 가능하게 하는 새로운 프레임워크인 Gideon을 제시합니다. Gideon은 모든 도메인에 대해 현실적인 도메인-문제-계획 튜플의 대규모 데이터셋을 체계적으로 생성하는 새로운 문제 생성기를 통합하고, 로컬 LLM에 신경기호 계획을 적용하여 온디바이스 실행과 다영역 지원을 위한 확장된 컨텍스트를 가능하게 합니다. 단일 도메인 시나리오에서 Qwen-2.5 1.5B에 대해 8k-32k 샘플로 훈련된 예비 실험 결과, 유효한 계획 비율이 66.1%(32k 모델)에 달하며, 추가 데이터를 통해 더욱 확장 가능함을 보여줍니다. 16k 샘플에 대한 다영역 테스트에서는 70.6%의 더 높은 계획 유효성 비율을 보이며, 도메인 간 확장성과 데이터 다양성이 학습 효율에 긍정적인 영향을 미칠 수 있음을 시사합니다. 긴 수평선 계획과 축소된 모델 크기로 인해 Gideon의 훈련은 대규모 LLM 기반 기준 모델보다 훨씬 비효율적이지만, 훈련된 모델이 기준 모델보다 약 120배 작고 추론 효율성, 확장성 및 다영역 적응성(인간-로봇 협업에서 중요한 요소)에서 상당한 이점을 얻을 수 있다는 점을 고려할 때 여전히 중요한 결과입니다. Gideon의 간소화된 데이터 생성 파이프라인을 통해 훈련 비효율성을 완화할 수 있습니다.

시사점, 한계점

시사점:
로컬 LLM을 활용하여 인간-로봇 협업에서의 PDDL 기반 계획의 확장성, 재계획, 지연 문제를 해결할 수 있는 새로운 프레임워크 Gideon 제시.
소규모 LLM을 사용하여 추론 효율성, 확장성, 다영역 적응성 향상.
다양한 도메인에 대한 대규모 데이터셋을 체계적으로 생성하는 문제 생성기 개발.
제한된 데이터로도 상당한 계획 생성 성능 달성 (단일 도메인 66.1%, 다영역 70.6%).
한계점:
대규모 LLM 기반 모델에 비해 훈련 효율성이 낮음.
현재는 단일 및 다영역 시나리오에 대한 제한적인 실험 결과만 제시.
장기 계획 수립에 대한 성능 평가 부족.
실제 인간-로봇 협업 환경에서의 성능 검증이 필요.
👍