LMArena( https://lmarena.ai/ )는 다수의 일반 대중을 상대로 대규모 언어 모델(LLM)들의 이름을 숨기고 품질을 평가하게 하는 방식으로 대규모 언어 모델(LLM)들을 평가하는 공개 웹 기반 플랫폼입니다.
사용자가 직접 프롬프트를 입력하고 모델명이 블라인드 처리된 두 모델의 답변에 대해 평가하는 식으로, 이후 두 답변 중에 선택을 하면 어떤 모델이였는지 표기하는 방식입니다. 사용자는 직접 상대 테스트할 모델을 선택할 수도 있습니다.
<꿀팁> 1. 테스트 비교를 통해 본인의 활용 용도에 적합한 LLM 모델 찾기 2. Leaderboard Overview ( https://lmarena.ai/leaderboard ) 를 통해 용도별 모델 평가 순위 확인 2. 무료로 LLM 모델 사용해보기 & 결과 얻기 (이미지 생성, 웹서치 기반 정보 등) 3. 평가를 위해 생성된 이미지들은 다운로드도 가능
현재 Web Search 와 Image Generation 두 가지 테스트를 지원하고 있으므로 원하는 프롬프트의 결과를 얻기 위해 어떤 모델이 더 좋은 지 비교 평가를 해보고 사용할 모델 선택하는 용도 또는 무료로 이미지나 정보 획득 :)