본 논문은 다중 모달 병리 이미지 이해를 위한 새로운 양방향 강화 학습 프레임워크를 제시합니다. 기존 방법들의 제한된 추론 능력과 높은 계산 비용 문제를 해결하기 위해, 두 개의 상승 작용적 분기를 도입합니다. 하나의 강화 학습 분기는 명시적인 추론 감독 없이 라벨로부터 과제 특정 의사 결정 과정(병리학적 근거)을 학습하여 추론 능력을 향상시키고, 다른 분기는 시각적 콘텐츠와 과제 맥락에 따라 각 이미지에 적합한 토큰 수를 동적으로 할당하여 계산 효율성을 최적화합니다. 시각적 질문 응답, 암 아형 분류, 병변 탐지 등 다양한 병리학적 과제에 적용하여 기존 모델 대비 평균 41.7%의 성능 향상과 70.3%의 추론 비용 절감을 달성했습니다.