본 논문은 다중 모달 대규모 언어 모델(MLLMs)을 추천 시스템에 적용하는 연구에 대한 기술 보고서입니다. MLLMs의 높은 지연 시간 문제를 해결하기 위해 효율적인 다중 모달 표현 학습 방법을 실험한 EReL@MIR 워크샵의 Task 2에서 우승한 방법론과 결과를 제시합니다. 특히, 다중 모달 클릭률 예측(Multimodal CTR Prediction)에 초점을 맞추고 있으며, 구현 코드와 학습된 모델 가중치를 공개합니다. 추후 연구 방향으로는 추천 신호를 다중 모달 표현에 효과적으로 통합하는 방법에 대한 논의를 포함합니다.