FinAudio: A Benchmark for Audio Large Language Models in Financial Applications
Created by
Haebom
Category
Empty
저자
Yupeng Cao, Haohang Li, Yangyang Yu, Shashidhar Reddy Javaji, Yueru He, Jimin Huang, Qianqian Xie, Xiao-yang Liu, K. P. Subbalakshmi, Meikang Qiu, Sophia Ananiadou, Jian-Yun Nie
개요
본 논문은 오디오 대규모 언어 모델(AudioLLMs)의 금융 분야에서의 성능을 평가하기 위한 벤치마크 \textsc{FinAudio}를 소개합니다. 금융 관련 오디오 데이터, 특히 실적 발표 통화 및 CEO 연설을 활용하여 재무 분석 및 투자 결정을 내리는 데 중요한 역할을 하는 AudioLLMs의 능력을 평가하는 것을 목표로 합니다. \textsc{FinAudio}는 단기 및 장기 금융 오디오에 대한 자동 음성 인식(ASR)과 장기 금융 오디오 요약의 세 가지 과제를 정의하고, 관련 데이터 세트를 구축합니다. 또한, 7개의 널리 사용되는 AudioLLMs을 \textsc{FinAudio}에서 평가하여 기존 모델의 한계를 파악하고 개선 방향을 제시합니다. 모든 데이터 세트와 코드는 공개될 예정입니다.