Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Small Language Models for Phishing Website Detection: Cost, Performance, and Privacy Trade-Offs

Created by
  • Haebom
Category
Empty

저자

Georg Goldenits, Philip Koenig, Sebastian Raubitzek, Andreas Ekelhart

개요

피싱 웹사이트는 심각한 사이버 보안 위협이며, 전통적인 머신러닝 방식은 feature engineering, 지속적인 재학습, 비용이 많이 드는 인프라 유지를 필요로 합니다. 독점적인 대규모 언어 모델(LLM)은 피싱 관련 분류 작업에서 강력한 성능을 보이지만, 운영 비용과 외부 제공업체 의존성은 많은 비즈니스 환경에서 실제 적용을 제한합니다. 이 논문은 SLM(Small Language Model)을 사용하여 원시 HTML 코드만으로 피싱 웹사이트를 탐지하는 가능성을 연구합니다. 10억에서 700억 개의 매개변수를 가진 15개의 SLM을 체계적으로 평가하여 분류 정확도, 계산 요구 사항 및 비용 효율성을 벤치마킹합니다. SLM은 최첨단 LLM에 비해 성능이 떨어지지만, 외부 LLM 서비스의 실행 가능한 대안을 제공할 수 있습니다.

시사점, 한계점

SLM은 로컬 인프라에 배포하여 데이터 및 운영에 대한 더 큰 제어를 제공할 수 있습니다.
SLM은 탐지 성능과 리소스 소비 간의 절충안을 제시합니다.
SLM은 독점 LLM에 비해 성능이 떨어지지만, 실행 가능한 대안을 제공할 수 있습니다.
이 연구는 피싱 탐지 시스템에서 SLM의 적응, 미세 조정 및 배포에 대한 향후 연구의 기초를 마련합니다.
👍