Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Look It Up: Analysing Internal Web Search Capabilities of Modern LLMs

Created by
  • Haebom
Category
Empty

저자

Sahil Kale

개요

본 논문은 최신 대규모 언어 모델(LLM)의 웹 검색 활용 효율성을 평가하는 벤치마크를 제시한다. 모델의 내부 상태나 파라미터에 접근하지 않고, 사전 지식으로 답할 수 있는 질문과 최신 정보를 요구하는 질문을 포함한 두 가지 유형의 질문 세트를 사용하여 웹 검색의 필요성과 효과를 분석한다. 실험 결과, 웹 검색은 모델의 정확도를 향상시키지만, 자신감 보정(confidence calibration)은 악화되는 경향을 보였다. 또한, 모델은 웹 검색을 자주 호출하지만, 쿼리 생성 능력 부족으로 정확도가 제한적이며, 초기 검색 실패 시 효과가 감소하는 것으로 나타났다.

시사점, 한계점

시사점:
내장된 웹 검색 기능은 팩트 정확도를 유의미하게 향상시킬 수 있다.
선택적 호출(selective invocation)이 가능하다.
웹 검색은 낮은 지연 시간의 검증 레이어(verification layer)로서 더 효과적이다.
한계점:
모델은 여전히 과도한 자신감을 보인다.
필수적인 경우에도 검색을 건너뛰는 경우가 있다.
초기 검색 쿼리의 성능이 저조할 경우, 그 효과가 떨어진다.
자신감 보정(confidence calibration)이 개선될 필요가 있다.
쿼리 생성 능력 부족으로 정확도가 제한적이다.
👍