멀티모달 대규모 언어 모델(MLLM)은 심사자로서 강력한 잠재력을 보여준다. 그러나 기존 방식은 MLLM을 단일 점수를 출력하도록 적응시키는 것은 MLLM의 생성적 특성과 맞지 않고 세부적인 요구 사항 이해를 제한하며, 자동 회귀 방식으로 심사 분석을 생성하는 것은 고 처리량 환경에서 지나치게 느리다는 근본적인 trade-off에 직면한다. 심사가 입력이 구조화된 요구 사항 집합을 충족하는지 확인하는 것으로 축소된다는 것을 관찰하여, 우리는 YOFO를 제안한다. YOFO는 템플릿 기반 조건부 방식으로, 단일 순방향 패스에서 모든 요구 사항을 심사한다. 자동 회귀 모델을 기반으로 구축된 YOFO는 구조화된 요구 사항 템플릿을 받아들이고, 한 번의 추론 단계에서 해당 요구 사항과 관련된 최종 토큰의 로짓을 읽어 각 요구 사항에 대해 이진 예/아니요 결정을 생성한다. 이 설계는 해석 가능성을 유지하면서 수십 배의 속도 향상을 가져온다. 광범위한 실험 결과 YOFO는 표준 추천 데이터 세트에서 최첨단 결과를 달성할 뿐만 아니라 종속성 인식 분석(후속 판단이 이전 판단에 조건부로 적용됨)을 지원하며 사후 CoT로부터 추가적인 이점을 얻는다.