Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Is Our Chatbot Telling Lies? Assessing Correctness of an LLM-based Dutch Support Chatbot

Created by
  • Haebom
Category
Empty

저자

Herman Lassche (AFAS Software, University Groningen), Michiel Overeem (AFAS Software), Ayushi Rastogi (University Groningen)

개요

AFAS는 고객 충성도를 높이기 위해 LLM을 활용하여 고객 문의에 응답하는 것을 목표로 한다. 본 연구는 네덜란드어로 된 응답의 정확성을 정의하고, 제한된 데이터로 LLM이 생성한 답변의 정확성을 실시간으로 평가하는 것을 목표로 한다. AFAS 지원팀의 의사 결정을 기반으로 응답의 정확성을 정의하고, 자연어 생성 및 자동 답변 평가 시스템에 대한 문헌을 활용하여 지원팀의 의사 결정을 자동화했다. 이진 응답 또는 지침을 요구하는 질문을 조사하여 자동화된 접근 방식이 지원 평가에 얼마나 근접하는지 테스트했다. 우리의 접근 방식은 55%의 경우에서 잘못된 메시지를 식별할 수 있었다.

시사점, 한계점

시사점:
LLM 기반 챗봇의 답변 정확성을 자동으로 평가하는 가능성을 보여줌.
정확성 평가를 위한 정의 및 메트릭을 제공함.
지역 언어 및 질문 유형에 따른 정확성 향상 제안.
한계점:
잘못된 메시지를 식별하는 정확도가 55%로 제한적임.
제한된 데이터로 학습.
👍