본 논문은 새로운 작업을 수행하도록 훈련될 시간이나 라벨링된 예시가 부족한 상황에서 인간을 돕는 임베디드 에이전트를 위한 프레임워크를 제시합니다. 이 프레임워크는 다양한 도메인에 대한 상당한 지식으로 훈련된 대규모 언어 모델(LLM)을 활용하여 작업 완료를 위한 추상적인 행동 순서를 예측합니다. 하지만 에이전트가 작업, 에이전트 또는 도메인 특정 제약으로 인해 이 순서를 실행하지 못할 수 있습니다. 따라서 LLM의 일반적인 예측과 지식 그래프(KG)에 인코딩된 사전 도메인 지식을 활용하여 에이전트가 새로운 작업에 빠르게 적응할 수 있도록 합니다. 로봇은 필요에 따라 인간의 입력을 요청하고 사용하여 기존 지식을 개선합니다. 시뮬레이션 환경의 요리 및 청소 작업을 통해 LLM만 사용하는 경우보다 LLM, KG 및 인간 입력의 상호 작용이 성능 향상에 크게 기여함을 실험적으로 입증합니다.
시사점, 한계점
•
시사점:
◦
LLM, KG, 그리고 인간 피드백을 결합하여 임베디드 에이전트의 새로운 작업 적응력을 향상시키는 효과적인 프레임워크 제시.
◦
시뮬레이션 환경에서 요리 및 청소 작업을 통해 제안된 프레임워크의 성능 향상을 실험적으로 검증.
◦
LLM의 일반적인 예측과 KG의 도메인 지식을 효과적으로 통합하는 방법 제시.
•
한계점:
◦
시뮬레이션 환경에서의 실험 결과이므로 실제 환경에서의 일반화 성능은 추가 검증 필요.
◦
인간 피드백에 대한 의존도가 높아, 인간 피드백이 지속적으로 제공되지 않는 상황에서는 성능 저하 가능성 존재.
◦
사용된 KG의 질과 범위가 프레임워크 성능에 영향을 미칠 수 있음. KG 구축 및 관리에 대한 추가적인 연구 필요.