본 논문은 의료 데이터의 부족으로 인해 어려움을 겪는 암 관련 의학 초록 분류 문제를 해결하기 위해 1,874개의 의생명학 초록으로 구성된 정제된 데이터셋을 제시합니다. 갑상선암, 대장암, 폐암 및 일반 주제로 분류된 이 데이터셋을 활용하여, 특히 데이터가 부족한 환경에서 분류 성능을 향상시키는 데 중점을 둡니다. 본 연구에서는 다중 그래프 어텐션 레이어를 통해 문서 내의 의미 정보와 구조적 관계를 포착하는 잔차 그래프 어텐션 네트워크(R-GAT) 모델을 제안합니다. R-GAT 모델의 성능을 BERT, RoBERTa, BioBERT, Bio+ClinicalBERT와 같은 다양한 Transformer 기반 모델, CNN, LSTM과 같은 심층 학습 모델, 그리고 로지스틱 회귀, SVM과 같은 전통적인 기계 학습 모델과 비교 분석합니다. 또한, 심층 학습 모델을 결합한 앙상블 기법과 TF-IDF, Word2Vec, BERT 및 RoBERTa 토크나이저와 같은 다양한 특징 추출 방법을 평가합니다. 결과적으로 R-GAT 모델은 다른 기법들보다 우수한 성능을 보이며, 각 암 종류와 일반 주제에 대해 높은 정밀도, 재현율 및 F1 점수를 달성합니다.