Sign In

Evaluating Large Language Models for Stance Detection on Financial Targets from SEC Filing Reports and Earnings Call Transcripts

Created by
  • Haebom
Category
Empty

저자

Nikesh Gyawali, Doina Caragea, Alex Vasenkov, Cornelia Caragea

개요

본 연구는 미국 증권거래위원회(SEC) 보고서 및 분기별 실적 발표 통화 기록(ECT)에서 추출한 문장을 사용하여 부채, 주당 순이익(EPS), 매출의 세 가지 핵심 재무 지표에 대한 문장 수준의 입장을 감지하는 데 초점을 맞춘 말뭉치를 소개한다. 연구에서는 Form 10-K 연례 보고서 및 ECT에서 추출한 문장에 대해 고급 ChatGPT-o3-pro 모델을 사용하여 긍정, 부정, 중립으로 입장을 레이블링하고, 엄격한 인간 검증을 거쳤다. 제로샷, 퓨샷, Chain-of-Thought (CoT) 프롬프트 전략을 사용하여 최신 대규모 언어 모델(LLM)을 체계적으로 평가한 결과, CoT 프롬프팅을 사용한 퓨샷이 감독 기반 모델보다 우수하며, LLM의 성능이 SEC 및 ECT 데이터 세트에 따라 다르다는 것을 확인했다.

시사점, 한계점

대규모 언어 모델(LLM)을 활용하여 광범위한 레이블링된 데이터 없이도 재무 분야에서 특정 대상에 대한 입장을 파악할 수 있는 실용적인 가능성을 보여줌.
퓨샷 방식과 Chain-of-Thought (CoT) 프롬프팅을 통해 감독 방식의 기준선보다 더 나은 성능을 달성함.
SEC 보고서와 ECT 데이터 세트 간에 LLM의 성능 차이가 존재함.
연구는 특정 재무 지표(부채, EPS, 매출)에 초점을 맞춰, 다른 재무 관련 측면에 대한 일반화에는 한계가 있을 수 있음.
ChatGPT-o3-pro 모델과 같은 특정 모델의 성능에 의존하며, 모델의 변경이나 업데이트에 따라 결과가 달라질 수 있음.
👍