자연어 처리(NLP)가 교육 데이터 마이닝에 활용되는 가운데, 특히 과학 관련 언어에서 수식과 같은 기호 표현의 어려움이 발생합니다. 본 연구는 이러한 기호 표현을 처리하는 최신 임베딩 모델의 성능을 평가합니다. 학생 답변에서 추출한 물리학 관련 기호 표현을 사용하여, 유사성 분석과 머신러닝 파이프라인 통합을 통해 다양한 임베딩 모델의 성능을 비교했습니다. OpenAI의 GPT-text-embedding-3-large 모델이 다른 모델보다 우수한 성능을 보였지만, 그 차이는 크지 않았습니다.