본 연구는 남미 COVID-19 환자의 스파이크 단백질 서열과 임상 메타데이터를 사용하여 COVID-19 중증도를 예측하는 하이브리드 CNN-LSTM 딥러닝 모델을 개발했습니다. GISAID 데이터베이스에서 3,467개의 스파이크 단백질 서열 (중증 2,313개, 경증 1,154개)을 사용하여, 서열에서 특징을 추출하고 인구통계학적 및 임상 변수는 one-hot encoding 했습니다. CNN-LSTM 아키텍처를 통해 모델을 학습시킨 결과, F1 score 82.92%, ROC-AUC 0.9084, 정밀도 83.56%, 재현율 82.85%의 성능을 달성했습니다. 가장 흔한 계통 (P.1, AY.99.2) 및 클레이드 (GR, GK)는 지역 유행병학적 추세와 일치하여 바이러스 유전체와 임상 결과 간의 연관성을 시사합니다. 결론적으로, 본 연구는 AI를 활용한 유전체 감시 및 정밀 공중 보건에 대한 유용성을 보여주는 COVID-19 중증도 예측 모델을 제시합니다.