본 논문은 최첨단 자율 에이전트가 훈련 및 환경 조건의 불일치로 인해 예상치 못한 동작이나 치명적인 오류를 일으킬 수 있다는 문제점을 지적합니다. 이러한 훈련/환경 모호성에 대한 강건성은 지능형 에이전트의 핵심 요구사항이며, 실제 세계에 에이전트를 배치할 때 오랫동안 해결되지 않은 과제입니다. 본 논문에서는 훈련을 통한 강건성 추구라는 주류 관점에서 벗어나, 설계상으로 이러한 핵심 속성을 갖도록 하는 자유 에너지 모델인 DR-FREE를 제시합니다. DR-FREE는 자유 에너지 최소화를 통해 강건성을 에이전트 의사결정 메커니즘에 직접 통합합니다. 강건한 자유 에너지 원리 확장과 새로운 해결 엔진을 결합하여 모호성에 대해 최적이면서도 강건한 정책을 반환합니다. 또한 최초로 최적 의사결정 및 필수 베이지안 신념 업데이트에 대한 모호성의 기전적 역할을 밝힙니다. 장애물로 가득 찬 모호한 환경을 탐색하는 실제 로버를 포함하는 실험 테스트베드에서 DR-FREE를 평가합니다. 모든 실험에서 DR-FREE는 로봇이 목표물로 성공적으로 이동할 수 있도록 하지만, DR-FREE를 사용하지 않는 표준 자유 에너지 최소화 에이전트는 실패합니다. 요약하자면, DR-FREE는 이전 방법으로는 해결할 수 없는 시나리오를 해결할 수 있으며, 이는 다중 에이전트 설정에서의 배포와, 어쩌면 더 깊은 수준에서, 거의 또는 전혀 훈련 없이 변덕스러운 환경에서 생존하는 자연 에이전트의 작동 방식에 대한 생물학적으로 타당한 설명을 추구하는 데 영감을 줄 수 있습니다.