본 논문은 소프트웨어 취약성 검출을 위한 새로운 머신러닝 모델 SecureFalcon을 제안합니다. 기존의 정적 분석이나 경계 모델 검증의 한계를 극복하기 위해, Falcon-40B 모델을 기반으로 1억 2천 1백만 개의 매개변수만을 사용하는 경량화된 모델 아키텍처를 설계했습니다. FormAI 데이터셋과 여러 공개 데이터셋(SySeVR, Draper VDISC, Bigvul, Diversevul, SARD Juliet, ReVeal)을 결합한 FalconVulnDB를 사용하여 훈련되었으며, CWE 상위 25개의 위험한 취약성을 중점적으로 다룹니다. SecureFalcon은 이진 분류에서 94%, 다중 분류에서 최대 92%의 정확도를 달성하며, CPU 기반 실시간 추론이 가능하다는 장점을 가지고 있습니다. BERT, RoBERTa, CodeBERT 등 기존 모델 및 전통적인 머신러닝 알고리즘보다 우수한 성능을 보여줍니다.