Sign In

GroupSHAP-Guided Integration of Financial News Keywords and Technical Indicators for Stock Price Prediction

Created by
  • Haebom
Category
Empty

저자

Minjoo Kim, Jinwoong Kim, Sangjin Park

개요

FinBERT와 같은 금융 특화 언어 모델의 발전으로 대중의 심리를 지수 기반 지표로 정량화할 수 있게 되었지만, 다양한 언어 신호를 단일 지표로 압축하는 것은 문맥적 뉘앙스를 간과하고 해석 가능성을 제한한다. 이 연구에서는 이러한 한계를 해결하기 위해 GroupSHAP을 활용한 GRU 기반 예측 프레임워크를 제시한다. 이 프레임워크는 개별 토큰 대신 의미적으로 관련된 키워드 그룹의 기여도를 정량화하여 계산 부담을 줄이면서 해석 가능성을 유지한다. 2015년부터 2024년까지의 뉴스 기사를 FinBERT로 임베딩하고 의미 그룹으로 클러스터링한 후 GroupSHAP을 적용하여 주가 변동에 대한 각 그룹의 기여도를 측정했다. S&P 500 지수의 하루 앞 예측 결과, GroupSHAP 메커니즘이 없는 벤치마크 모델에 비해 MAE는 32.2%, RMSE는 40.5% 감소했다. 이 연구는 뉴스 기반 금융 예측에 GroupSHAP을 처음 적용하여 그룹화된 감성 표현이 해석 가능성과 예측 성능을 동시에 향상시킴을 보여준다.

시사점, 한계점

시사점:
GroupSHAP을 활용하여 계산 비용을 줄이면서도 해석 가능성을 유지하는 뉴스 기반 금융 예측 모델 제시
S&P 500 지수 예측에서 벤치마크 모델 대비 향상된 예측 성능 (MAE 32.2% 감소, RMSE 40.5% 감소)
그룹화된 감성 표현을 통해 해석 가능성 및 예측 성능 동시 향상 입증
GroupSHAP을 금융 예측 분야에 최초로 적용
한계점:
연구 범위가 S&P 500 지수에 한정되어 다른 지수나 자산에 대한 일반화 필요
GRU 모델의 성능은 하이퍼파라미터 튜닝에 따라 달라질 수 있으며, 최적화된 하이퍼파라미터 설정에 대한 추가 연구 필요
뉴스 기사 외 다른 데이터 소스 (소셜 미디어, 블로그 등)의 활용 가능성 탐색 필요
GroupSHAP에 사용된 키워드 그룹의 효과적인 클러스터링 방법론에 대한 추가 연구 필요
👍