Generation of Geodesics with Actor-Critic Reinforcement Learning to Predict Midpoints
Created by
Haebom
Category
Empty
저자
Kazumi Kasaura
개요
본 논문은 무한소로 정의된 메트릭을 갖는 다양체 상에서 모든 쌍에 대한 최단 경로를 찾는 새로운 프레임워크를 제시한다. 이 프레임워크는 중간점을 재귀적으로 예측하여 최단 경로를 생성한다. 중간점 예측을 위해 행위자-비평가 방식을 제안하며, 이 방식의 타당성을 증명한다. 실험적으로 제안된 방법이 복잡한 운동역학을 가진 에이전트의 경로 계획 및 다자유도 로봇 팔의 동작 계획 등 여러 계획 작업에서 기존 방법보다 우수한 성능을 보임을 보여준다.
시사점, 한계점
•
시사점:
◦
무한소 메트릭을 갖는 다양체 상에서 모든 쌍의 최단 경로를 효율적으로 계산하는 새로운 방법 제시.
◦
복잡한 운동역학을 가진 에이전트 및 다자유도 로봇 팔의 경로/동작 계획 문제에 효과적으로 적용 가능성을 입증.