Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

MegaChat: A Synthetic Persian Q&A Dataset for High-Quality Sales Chatbot Evaluation

Created by
  • Haebom
Category
Empty

저자

Mahdi Rahmani, AmirHossein Saffari, Reyhane Rahmani

개요

본 논문은 이란의 중소기업(SME)이 텔레그램을 활용한 판매에서 AI 기반 챗봇 구축에 필요한 페르시아어 질문-답변(Q&A) 데이터셋의 부족 문제를 해결하기 위해, 완전 합성된 페르시아어 Q&A 데이터셋인 MegaChat을 소개합니다. 텔레그램 쇼핑 채널 데이터를 활용하는 자동화된 멀티 에이전트 아키텍처를 통해 페르소나를 고려한 Q&A 쌍을 생성하며, 다양한 검색 증강 생성(RAG) 모델과 에이전트 기반 시스템을 비교하여 성능을 평가합니다. MegaChat은 저자원 언어 환경에서 지능형 고객 응대 시스템 구축을 위한 효율적이고 비용 효율적인 솔루션을 제공합니다.

시사점, 한계점

시사점:
페르시아어와 같은 저자원 언어 환경에서 AI 챗봇 개발에 필요한 고품질 데이터셋을 생성하는 효율적인 방법 제시.
자동화된 멀티 에이전트 아키텍처를 통해 현실적이고 다양한 대화 데이터를 대규모로 생성 가능.
전통적인 RAG 모델 대비 에이전트 기반 시스템의 우수한 성능 입증.
SME가 지능형 고객 응대 시스템을 구축할 수 있는 비용 효율적인 솔루션 제공.
한계점:
GPT-5.1을 활용한 평가 방식의 일반화 가능성에 대한 추가 검증 필요.
특정 상업 도메인에 초점을 맞춘 데이터셋의 다른 도메인으로의 확장성 검토 필요.
데이터셋 생성 및 평가에 사용된 특정 기술(예: 텔레그램 채널 분석, GPT-5.1)의 변화에 따른 성능 변동 가능성 고려.
👍