Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

FinAudio: A Benchmark for Audio Large Language Models in Financial Applications

Created by
  • Haebom
Category
Empty

저자

Yupeng Cao, Haohang Li, Yangyang Yu, Shashidhar Reddy Javaji, Yueru He, Jimin Huang, Zining Zhu, Qianqian Xie, Xiao-yang Liu, Koduvayur Subbalakshmi, Meikang Qiu, Sophia Ananiadou, Jian-Yun Nie

개요

본 논문에서는 금융 분야의 오디오 데이터(예: 실적 발표 컨퍼런스 콜, CEO 연설)를 분석하고 투자 결정에 활용하기 위한 목적으로, 금융 시나리오에서 AudioLLM(오디오 대규모 언어 모델)을 평가하는 최초의 벤치마크인 FinAudio를 제시합니다. FinAudio는 짧은 금융 오디오에 대한 ASR, 긴 금융 오디오에 대한 ASR, 긴 금융 오디오의 요약이라는 세 가지 과제를 정의하고, 이를 평가하기 위한 두 개의 짧은 오디오 데이터셋, 두 개의 긴 오디오 데이터셋, 그리고 금융 오디오 요약을 위한 새로운 데이터셋을 구성합니다. 7개의 기존 AudioLLM을 FinAudio로 평가하여 기존 모델의 한계를 밝히고 향후 개선 방향을 제시합니다. 모든 데이터셋과 코드는 공개될 예정입니다.

시사점, 한계점

시사점:
금융 분야 특화 AudioLLM 평가를 위한 최초의 벤치마크 FinAudio 제시
기존 AudioLLM의 금융 분야 적용에 대한 한계점을 명확히 제시
금융 오디오 데이터 분석 및 활용을 위한 새로운 가능성 제시
향후 AudioLLM 개발 및 개선 방향 제시
모든 데이터셋과 코드 공개를 통한 연구 투명성 확보
한계점:
FinAudio 벤치마크의 데이터셋 규모 및 다양성 제한 (향후 확장 필요성)
평가 대상 AudioLLM의 종류 및 수 제한 (다양한 모델 추가 필요성)
금융 시나리오의 복잡성을 완벽히 반영하지 못할 가능성 (향후 개선 필요성)
👍