본 논문은 목적 지향적 행동의 계산 모델에서 기술적 측면과 처방적 측면을 결합하는 새로운 프레임워크를 제시합니다. 강화 학습에서 일반적으로 처방적 보상 함수는 미리 정의된 고정된 기술적 상태 표현에 의존하지만, 본 논문에서는 목표가 획득된 상태 표현을 형성하고 그 반대의 경우도 가능하다는 점을 고려하여 기술적 및 처방적 측면이 상호 의존적으로 나타날 수 있음을 제시합니다. 특히, 제한된 에이전트에서의 상태 표현 학습을 위한 계산 프레임워크를 제시하며, 목표 지향적 상태(telic state) 개념을 통해 기술적 및 처방적 측면을 연결합니다. '텔릭-제어 가능성(telic-controllability)' 개념을 도입하여 텔릭 상태 표현의 세분성과 모든 텔릭 상태에 도달하는 데 필요한 정책 복잡성 간의 절충 관계를 특징짓고, 이를 학습하는 알고리즘을 제안하여 시뮬레이션된 탐색 작업을 통해 설명합니다. 결론적으로, 본 논문은 목표 유연성과 인지적 복잡성 간의 균형을 맞추는 상태 표현 학습에서 '의도적인 무시(deliberate ignorance)'의 역할을 강조합니다.