피싱 웹사이트는 심각한 사이버 보안 위협이며, 전통적인 머신러닝 방식은 feature engineering, 지속적인 재학습, 비용이 많이 드는 인프라 유지를 필요로 합니다. 독점적인 대규모 언어 모델(LLM)은 피싱 관련 분류 작업에서 강력한 성능을 보이지만, 운영 비용과 외부 제공업체 의존성은 많은 비즈니스 환경에서 실제 적용을 제한합니다. 이 논문은 SLM(Small Language Model)을 사용하여 원시 HTML 코드만으로 피싱 웹사이트를 탐지하는 가능성을 연구합니다. 10억에서 700억 개의 매개변수를 가진 15개의 SLM을 체계적으로 평가하여 분류 정확도, 계산 요구 사항 및 비용 효율성을 벤치마킹합니다. SLM은 최첨단 LLM에 비해 성능이 떨어지지만, 외부 LLM 서비스의 실행 가능한 대안을 제공할 수 있습니다.