Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Improving Your Model Ranking on Chatbot Arena by Vote Rigging

Created by
  • Haebom

저자

Rui Min, Tianyu Pang, Chao Du, Qian Liu, Minhao Cheng, Min Lin

개요

Chatbot Arena는 사용자가 두 개의 익명 모델의 응답 중 선호하는 응답을 투표하는 방식으로 대규모 언어 모델(LLM)을 평가하는 플랫폼입니다. 본 논문은 크라우드소싱 투표를 조작하여 특정 모델의 순위를 인위적으로 높이거나 낮출 수 있음을 보여줍니다. 먼저, 특정 모델에만 집중하여 투표하는 단순한 조작 전략을 소개하고, 이 전략의 비효율성을 지적합니다. 이를 극복하기 위해, Chatbot Arena의 Elo 평점 메커니즘을 이용하여 특정 모델과 직접적으로 관련되지 않은 대결에도 투표를 조작하여 순위에 영향을 미치는 전방위적 조작 전략을 제안합니다. 170만 건의 기존 투표 데이터를 사용한 실험을 통해, 수백 건의 새로운 투표만으로도 전방위적 조작 전략이 모델 순위를 개선할 수 있음을 보여줍니다. 몇 가지 방어 메커니즘을 평가했지만, 투표 조작 방지 노력의 중요성을 강조합니다.

시사점, 한계점

시사점: Chatbot Arena와 같은 크라우드소싱 기반 LLM 평가 플랫폼의 취약성을 보여줌. 전방위적 조작 전략을 통해 상대적으로 적은 투표 조작으로도 모델 순위를 크게 변화시킬 수 있음을 증명. LLM 평가 플랫폼의 신뢰성 확보를 위한 투표 조작 방지 기술 개발의 중요성 강조.
한계점: 제안된 방어 메커니즘의 효과에 대한 자세한 분석 부족. 다양한 유형의 조작 전략에 대한 포괄적인 분석 부족. 실제 Chatbot Arena 시스템에 대한 직접적인 조작 시도가 아닌, 기존 데이터 분석에 기반한 연구임. 특정 조작 전략의 성공률에 영향을 미치는 요인(예: 투표자의 참여도, 모델의 특성 등)에 대한 심층 분석 부족.
👍