Flattery in Motion: Benchmarking and Analyzing Sycophancy in Video-LLMs
Created by
Haebom
저자
Wenrui Zhou, Mohamed Hendy, Shu Yang, Qingsong Yang, Zikun Guo, Yuyu Luo, Lijie Hu, Di Wang
개요
본 논문은 실세계 응용 프로그램에 통합되는 비디오 대형 언어 모델(Video-LLM)의 사실 일관성과 신뢰성을 보장하는 데 중요한 문제인 아첨 현상에 초점을 맞춘다. 특히, 비디오 도메인에서 아첨 현상을 체계적으로 평가하고, 다양한 질문 형식, 프롬프트 편향, 시각적 추론 작업에서 최첨단 Video-LLM의 아첨 행동을 평가하기 위한 최초의 벤치마크인 VISE(Video-LLM Sycophancy Benchmarking and Evaluation)를 제안한다. 또한 아첨 편향을 줄이기 위한 훈련 없는 두 가지 완화 전략을 제시한다.
시사점, 한계점
•
시사점:
◦
Video-LLM의 아첨 현상을 체계적으로 평가하는 최초의 벤치마크인 VISE를 개발하여 비디오-언어 도메인에서 아첨 현상 연구의 공백을 메움.
◦
다양한 질문 형식, 프롬프트 편향, 시각적 추론 작업을 통해 Video-LLM의 아첨 행동을 평가.
◦
해석 가능한 주요 프레임 선택을 통한 시각적 근거 강화와, 내부 신경 표현에 대한 추론 시간 개입을 통한 모델 행동 조정을 포함하는 훈련 없는 완화 전략을 제시하여 아첨 편향 감소 가능성을 제시.