아기 발달을 모방하여, BabyBench 시뮬레이션 환경에서 자율적인 자기 탐구를 수행하는 로봇 에이전트 Baby Sophia를 위한 강화 학습(RL) 프레임워크를 제안합니다. 이 에이전트는 유아의 호기심에 기반한 신체 탐구를 모방한 내적 보상을 통해 자가 접촉 및 손 주시 행동을 학습합니다. 고차원 촉각 입력을 의미 있는 표현으로 변환하여 효율적인 학습을 가능하게 하며, 내적 보상과 광범위한 신체 커버리지, 균형 및 일반화를 장려하는 커리큘럼 학습을 통해 새로운 촉각 접촉을 발견합니다. 또한, 모터 버블링을 통해 손의 시각적 특징(피부색, 형태)을 학습하고, 내적 보상을 통해 새로운 손 동작을 수행하고 시선을 손에 고정하도록 유도합니다. 단일 손에서 양손 훈련으로의 커리큘럼 학습을 통해 복잡한 시각-운동 조정을 달성합니다. 순전히 호기심에 기반한 신호만으로 외부 감독 없이도 유아의 무작위 운동 버블링에서 목적 있는 행동으로의 발달을 모방하는 다중 모드 학습이 가능하다는 것을 보여줍니다.
시사점, 한계점
•
시사점:
◦
순수한 호기심 기반 신호만으로 자율적인 로봇 학습 가능성을 제시했습니다.
◦
유아 발달 과정을 모방한 학습 방식을 통해 복잡한 시각-운동 조정 학습을 달성했습니다.
◦
고차원 데이터를 효율적으로 처리하기 위한 표현 학습 기술을 활용했습니다.
•
한계점:
◦
BabyBench 시뮬레이션 환경에서만 검증되었으며, 실제 환경으로의 일반화는 추가 연구가 필요합니다.