Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

You Only Forward Once: An Efficient Compositional Judging Paradigm

Created by
  • Haebom
Category
Empty

저자

Tianlong Zhang, Hongwei Xue, Shilin Yan, Di Wu, Chen Xu, Yunyun Yang

개요

멀티모달 대규모 언어 모델(MLLM)은 심사자로서 강력한 잠재력을 보여준다. 그러나 기존 방식은 MLLM을 단일 점수를 출력하도록 적응시키는 것은 MLLM의 생성적 특성과 맞지 않고 세부적인 요구 사항 이해를 제한하며, 자동 회귀 방식으로 심사 분석을 생성하는 것은 고 처리량 환경에서 지나치게 느리다는 근본적인 trade-off에 직면한다. 심사가 입력이 구조화된 요구 사항 집합을 충족하는지 확인하는 것으로 축소된다는 것을 관찰하여, 우리는 YOFO를 제안한다. YOFO는 템플릿 기반 조건부 방식으로, 단일 순방향 패스에서 모든 요구 사항을 심사한다. 자동 회귀 모델을 기반으로 구축된 YOFO는 구조화된 요구 사항 템플릿을 받아들이고, 한 번의 추론 단계에서 해당 요구 사항과 관련된 최종 토큰의 로짓을 읽어 각 요구 사항에 대해 이진 예/아니요 결정을 생성한다. 이 설계는 해석 가능성을 유지하면서 수십 배의 속도 향상을 가져온다. 광범위한 실험 결과 YOFO는 표준 추천 데이터 세트에서 최첨단 결과를 달성할 뿐만 아니라 종속성 인식 분석(후속 판단이 이전 판단에 조건부로 적용됨)을 지원하며 사후 CoT로부터 추가적인 이점을 얻는다.

시사점, 한계점

시사점:
MLLM 기반 심사에서 속도와 해석 가능성을 모두 향상시키는 새로운 접근 방식 제안.
단일 패스에서 여러 요구 사항을 평가하여 효율성 증대.
표준 추천 데이터셋에서 SOTA 달성.
종속성 인식 분석 및 사후 CoT 지원.
한계점:
구체적인 한계점은 논문 요약에서 명시적으로 언급되지 않음.
👍