본 논문은 Long Short-Term Memory (LSTM) 예측과 Proximal Policy Optimization (PPO) 강화 학습 전략을 융합한 하이브리드 포트폴리오 최적화 프레임워크를 소개합니다. 심층 순환 신경망의 예측 능력을 활용하여 시간적 의존성을 포착하고, PPO 에이전트가 연속적인 행동 공간에서 포트폴리오 할당을 적응적으로 개선하여 시장 변화에 동적으로 대응하면서 추세를 예측합니다. 2018년 1월부터 2024년 12월까지 미국 및 인도네시아 주식, 미국 국채, 주요 암호화폐를 포함하는 다중 자산 데이터 세트를 사용하여, 등가 가중, 지수 스타일, 단일 모델 변형(LSTM 전용 및 PPO 전용)을 포함한 여러 기준선과 비교하여 모델을 평가합니다.