본 논문은 행동 모델 학습에서 행동의 역동성 학습이 아닌, 행동 비용 학습에 초점을 맞춘 연구입니다. 기존 연구들이 계획 작업의 유효한 계획을 명시하는 데 집중한 것과 달리, 본 논문은 입력 계획 집합이 결과 계획 모델 하에서 최적이 되도록 하는 행동 비용 집합을 학습하는 새로운 문제를 제시합니다. 이 문제를 해결하기 위해, 레이블이 없는 입력 계획으로부터 행동 비용을 학습하는 알고리즘인 $LACFIP^k$를 제안하고, 이론적 및 실험적 결과를 통해 $LACFIP^k$의 성공적인 수행을 보여줍니다.