Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

FinAudio: A Benchmark for Audio Large Language Models in Financial Applications

Created by
  • Haebom
Category
Empty

저자

Yupeng Cao, Haohang Li, Yangyang Yu, Shashidhar Reddy Javaji, Yueru He, Jimin Huang, Qianqian Xie, Xiao-yang Liu, K. P. Subbalakshmi, Meikang Qiu, Sophia Ananiadou, Jian-Yun Nie

개요

본 논문은 오디오 대규모 언어 모델(AudioLLMs)의 금융 분야에서의 성능을 평가하기 위한 벤치마크 \textsc{FinAudio}를 소개합니다. 금융 관련 오디오 데이터, 특히 실적 발표 통화 및 CEO 연설을 활용하여 재무 분석 및 투자 결정을 내리는 데 중요한 역할을 하는 AudioLLMs의 능력을 평가하는 것을 목표로 합니다. \textsc{FinAudio}는 단기 및 장기 금융 오디오에 대한 자동 음성 인식(ASR)과 장기 금융 오디오 요약의 세 가지 과제를 정의하고, 관련 데이터 세트를 구축합니다. 또한, 7개의 널리 사용되는 AudioLLMs을 \textsc{FinAudio}에서 평가하여 기존 모델의 한계를 파악하고 개선 방향을 제시합니다. 모든 데이터 세트와 코드는 공개될 예정입니다.

시사점, 한계점

시사점:
금융 분야에 특화된 최초의 AudioLLMs 벤치마크를 제시하여 이 분야 연구를 촉진.
기존 AudioLLMs의 금융 분야에서의 한계를 밝혀내고, 개선 방향 제시.
단기 및 장기 ASR, 그리고 요약 과제를 포함하는 다양한 평가 방식 제공.
모든 데이터 세트와 코드 공개를 통해 연구의 재현성과 확장을 용이하게 함.
한계점:
AudioLLMs의 금융 분야 한정적인 평가.
평가에 사용된 AudioLLMs의 종류가 제한적일 수 있음.
벤치마크의 실제 금융 시장에서의 실용성 검증 부족.
👍