Sign In

Detecting Vulnerabilities from Issue Reports for Internet-of-Things

Created by
  • Haebom
Category
Empty

저자

Sogol Masoumzadeh

개요

본 논문은 사물 인터넷 (IoT) 시스템의 취약점을 나타내는 이슈 보고서를 적시에 식별하는 것을 목표로 한다. 이를 위해 (1) 기계 학습 (ML)과 대규모 언어 모델 (LLM)을 자연어 처리 (NLP) 기술과 결합하여 21개의 Eclipse IoT 프로젝트의 취약점 관련 이슈를 탐지하고, (2) 사전 훈련된 BERT Masked Language Model (MLM)을 11,000개의 GitHub 이슈 데이터로 미세 조정하여 분류하는 두 가지 접근 방식을 제안한다. 최상의 성능은 BERT NLP 특징을 기반으로 훈련된 Support Vector Machine (SVM) 모델에서 AUC 0.65를 달성했으며, 미세 조정된 BERT 모델은 0.26의 정확도를 보였다.

시사점, 한계점

시사점:
IoT 시스템에서 취약점 관련 이슈 탐지를 위한 첫 번째 시도.
ML과 LLM을 활용한 새로운 접근 방식 제시.
BERT 기반 모델의 활용 가능성 제시.
GitHub 이슈 데이터셋 활용.
한계점:
최고 성능 모델의 AUC가 0.65로 제한적임.
BERT 모델의 정확도가 낮음 (0.26).
훈련 데이터 노출의 중요성 강조.
실질적인 시스템 적용에 대한 추가 연구 필요.
👍