기존 도구 기반 에이전트 시스템의 한계를 극복하기 위해, 흉부 X-Ray(CXR) 추론을 위한 최초의 멀티모달 프레임워크인 PASS(Probabilistic Agentic Supernet Sampling)를 제안합니다. PASS는 멀티-툴 그래프에서 에이전트 워크플로우를 적응적으로 샘플링하여 해석 가능한 확률로 주석 처리된 의사 결정 경로를 생성합니다. 복잡한 CXR 추론 작업에서 PASS는 학습된 작업 조건부 분포를 활용하여 각 슈퍼넷 레이어에서 가장 적합한 도구를 선택하고, 사후 감사를 위한 확률 주석 처리된 궤적을 제공하며, 의료 AI 안전을 직접적으로 향상시킵니다. 또한, PASS는 중요한 소견을 지속적으로 압축하여 개인화된 메모리를 구축하고, 추론 경로를 심화할지 또는 효율성을 위해 조기 종료할지 동적으로 결정합니다. 성능과 비용의 균형을 맞추기 위해 전문가 지식 워밍업, 대조 경로 랭킹, 비용 인식 강화 학습을 포함하는 3단계 훈련 절차를 설계했습니다. 또한, CAB-E라는 포괄적인 벤치마크를 도입하여 엄격한 평가를 수행했습니다. 다양한 벤치마크에서 PASS는 강력한 기준선보다 여러 메트릭(정확도, AUC, LLM-J 등)에서 유의미하게 우수한 성능을 보이며 계산 비용의 균형을 맞추어, 해석 가능하고 적응적이며 멀티모달한 의료 에이전트 시스템을 향한 새로운 패러다임 변화를 이끌었습니다.