Routing to the Right Expertise: A Trustworthy Judge for Instruction-based Image Editing
Created by
Haebom
저자
Chenxi Sun, Hongzhi Zhang, Qi Wang, Fuzheng Zhang
개요
본 논문은 명령어 기반 이미지 편집(IIE) 모델의 성능 평가를 위한 새로운 방법인 JURE(JUdgement through Routing of Expertise)를 제안합니다. 기존 IIE 평가 방법들이 인간의 판단과 일치하지 않고 설명력이 부족하다는 점을 지적하며, JURE는 각기 다른 전문 지식을 가진 여러 모델(전문가)을 활용하여 입력 명령어와 출력 이미지를 적절한 전문가에게 라우팅하고, 그들의 피드백을 종합하여 최종 평가를 내리는 방식으로 설계되었습니다. JURE는 라우팅된 전문가와 그들의 피드백을 통해 설명 가능성을 제공하며, 인간의 판단과 높은 일치율을 보이는 신뢰할 수 있는 평가 방법임을 실험적으로 입증합니다. 또한, 모듈형 설계로 향후 IIE 모델의 발전에 유연하게 대응할 수 있다는 장점을 가지고 있습니다. 평가 데이터와 결과는 공개 저장소(https://github.com/Cyyyyyrus/JURE.git)에서 확인할 수 있습니다.
시사점, 한계점
•
시사점:
◦
인간의 판단과 높은 일치율을 보이는 새로운 IIE 모델 평가 방법 제시
◦
설명 가능한 AI(Explainable AI, XAI)를 구현하여 평가 과정의 투명성 확보