Sign In

DocFinQA: A Long-Context Financial Reasoning Dataset

Created by
  • Haebom
Category
Empty

저자

Varshini Reddy, Rik Koncel-Kedziorski, Viet Dac Lai, Michael Krumdick, Charles Lovering, Chris Tanner

개요

본 논문은 대규모 언어 모델(LLM)이 금융 분야에서 효과적으로 사용되기 위해 현실적인 과제와 데이터를 연구하는 데 초점을 맞추고 있다. 금융 전문가들은 수백 페이지에 달하는 문서를 다루지만, 기존 금융 연구 데이터셋은 짧은 발췌본만을 다루는 한계를 지닌다. 이러한 문제를 해결하기 위해, 저자들은 긴 문서 기반의 금융 QA 과제인 DocFinQA를 제안한다. FinQA 데이터셋의 7,437개 질문에 전체 문서 컨텍스트를 추가하여 평균 컨텍스트 길이를 FinQA의 700단어 미만에서 DocFinQA의 123,000단어로 확장했다. 검색 기반 QA 파이프라인과 긴 컨텍스트 언어 모델에 대한 광범위한 실험을 수행한 결과, DocFinQA는 최첨단 시스템에게도 상당한 도전 과제임을 확인했다. 또한 DocFinQA에서 가장 긴 문서에 대한 사례 연구를 통해 모델이 특히 어려움을 겪는다는 사실을 발견했다. 이 연구는 유전자 서열 분석 및 법적 문서 계약 분석과 같이 특정성과 장거리 컨텍스트가 중요한 애플리케이션에 광범위한 영향을 미칠 수 있다.

시사점, 한계점

시사점:
긴 문서 기반의 금융 QA 과제인 DocFinQA를 제시하여 현실적인 금융 데이터 환경을 반영했다.
DocFinQA를 통해 최첨단 시스템의 성능 한계를 보여주고, 장거리 컨텍스트 이해의 중요성을 강조했다.
금융 분야 외에도 특정성 및 장거리 컨텍스트가 중요한 다른 분야(유전자 서열 분석, 법률 문서 분석 등)에도 적용 가능성을 제시했다.
한계점:
DocFinQA 데이터셋 구축 및 실험 결과에 대한 구체적인 내용이 부족할 수 있다.
모델의 구체적인 실패 사례 및 원인 분석이 충분하지 않을 수 있다.
제안된 DocFinQA의 일반화 가능성 및 다른 도메인으로의 확장성에 대한 추가적인 연구가 필요하다.
👍