불확실성 하에서 순차적 의사 결정 작업을 수행하는 자율 에이전트는 외부 작업 제안으로부터 이점을 얻을 수 있지만, 제안의 신뢰성은 본질적으로 다양합니다. 기존 방법은 정적이고 알려진 제안자 품질 매개변수를 가정하여 실제 적용에 제약이 있습니다. 본 논문에서는 부분 관측 환경에서 변화하는 제안자 신뢰성에 동적으로 학습하고 적응하는 프레임워크를 소개합니다. 먼저, 제안자 품질을 에이전트의 신념 표현에 직접 통합하여, 제안자 유형에 대한 베이즈 추론을 통해 에이전트가 제안에 대한 의존도를 추론하고 조정할 수 있도록 합니다. 둘째, 에이전트가 정보 획득과 획득 비용의 균형을 맞추면서, 중요한 순간에 전략적으로 제안을 요청할 수 있는 명시적인 "요청" 작업을 도입합니다. 실험적 평가는 다양한 제안자 품질, 변화하는 신뢰성에 대한 적응, 제안 요청의 전략적 관리를 통해 견고한 성능을 보여줍니다. 본 연구는 불확실한 환경에서 제안 불확실성을 해결함으로써 적응형 인간-에이전트 협업의 기반을 제공합니다.