본 논문은 금융 시계열 예측의 어려움과 기존 접근 방식의 한계(데이터 표준화로 인한 정보 손실, 고정된 변수 개수 및 과거 시계열 길이, 해석력 및 예측 불확실성)를 지적합니다. 이를 해결하기 위해 다양한 금융 이미지-텍스트 데이터셋(FVLDB)을 구축하고, 예측과 불확실성 분석이 가능한 불확실성 조정 그룹 상대 정책 최적화(UARPO) 방법을 개발했습니다. UARPO로 미세 조정된 다중 모달 사전 훈련 모델 FinZero를 제안하여 FVLDB 금융 시계열에 대한 추론, 예측 및 분석적 이해를 수행합니다. 실험 결과, FinZero는 강력한 적응력과 확장성을 보이며, 특히 GPT-4o 대비 고신뢰도 그룹에서 약 13.48%의 예측 정확도 향상을 보여 다중 모달 대규모 모델에서 강화 학습 미세 조정의 효과를 입증합니다.