यह शोधपत्र व्यवहार मॉडल अधिगम में क्रिया गतिशीलता सीखने के बजाय, क्रिया लागत सीखने पर केंद्रित है। नियोजन कार्यों के लिए मान्य योजनाएँ निर्दिष्ट करने पर केंद्रित पिछले अध्ययनों के विपरीत, यह शोधपत्र एक नई समस्या प्रस्तुत करता है: क्रिया लागतों के एक ऐसे समूह को सीखना जो यह सुनिश्चित करता है कि परिणामी नियोजन मॉडल के अंतर्गत इनपुट योजनाओं का एक समूह इष्टतम हो। इस समस्या के समाधान के लिए, हम $LACFIP^k$, एक एल्गोरिथम प्रस्तावित करते हैं जो बिना लेबल वाली इनपुट योजनाओं से क्रिया लागत सीखता है। हम सैद्धांतिक और प्रायोगिक परिणामों के माध्यम से $LACFIP^k$ के सफल निष्पादन को प्रदर्शित करते हैं।