When Should a Robot Think? Resource-Aware Reasoning via Reinforcement Learning for Embodied Robotic Decision-Making

작성자

Haebom

카테고리

Empty

저자

Jun Liu, Pu Zhao, Zhenglun Kong, Xuan Shen, Peiyan Dong, Fan Yang, Lin Cui, Hao Tang, Geng Yuan, Wei Niu, Wenbin Zhang, Xue Lin, Gaowen Liu, Yanzhi Wang, Dong Huang

💡 개요

로봇이 환경과 상호작용할 때 LLM 기반 에이전트는 고수준 추론 및 의사결정에 중요하지만, LLM 호출은 상당한 지연과 자원 소모를 유발합니다. 본 논문은 로봇이 언제 추론하고 언제 행동해야 하는지에 대한 근본적인 문제를 해결하고자 합니다. 이를 위해 RARRL(Resource-Aware Reasoning via Reinforcement Learning)이라는 계층적 프레임워크를 제안하며, 이는 관찰, 실행 기록, 남은 자원을 기반으로 추론 여부, 추론 역할, 계산 예산을 적응적으로 결정합니다.

🔑 시사점 및 한계

•

로봇이 LLM 추론을 언제, 어떻게 사용할지 자원 제약을 고려하여 동적으로 결정하는 것이 효율적이고 신뢰성 있는 로봇 시스템 구축에 필수적입니다.

•

RARRL은 다양한 상황에서 추론을 최적화하여 작업 성공률을 높이고 지연 시간을 줄이며 견고성을 향상시켰습니다.

•

현재 연구는 특정 로봇 플랫폼 및 환경에 대한 실험으로 진행되었으며, 다양한 로봇 하드웨어 및 복잡한 실제 환경으로의 일반화는 추가 연구가 필요합니다.

PDF 보기

Made with Slashpage