# Learning Generalizable Multimodal Representations for Software Vulnerability Detection

### 저자

Zeming Dong, Yuejun Guo, Qiang Hu, Yao Zhang, Maxime Cordy, Hao Liu, Mike Papadakis, Yongqiang Lyu

### 💡 개요

본 논문은 소스 코드와 주석이라는 두 가지 모달리티를 활용하여 소프트웨어 취약점 탐지 성능을 향상시키는 MultiVul 프레임워크를 제안합니다. MultiVul은 듀얼 유사도 학습과 일관성 정규화를 통해 코드와 주석 표현을 정렬하며, 다양한 코드-텍스트 쌍을 사용하여 견고성을 높입니다. 실험 결과, 기존 단일 모달리티 기반 방법론에 비해 상당한 F1 점수 향상을 달성했습니다.

### 🔑 시사점 및 한계

- 코드의 구조적 논리와 주석의 개발자 의도를 결합하여 취약점 탐지의 정확성과 일반화 성능을 높일 수 있습니다.

- 여러 대규모 언어 모델(LLM)에 적용 가능하며, 프롬프트 기반 및 코드 단독 미세 조정 방식 대비 우수한 성능을 보입니다.

- 제안된 프레임워크의 효율적인 추론 속도 유지는 중요한 장점입니다.

- 학습 데이터셋의 다양성과 LLM 자체의 특성이 결과에 영향을 미칠 수 있으며, 더욱 복잡하고 다양한 코드 구조 및 논리 관계에서의 성능을 추가적으로 검증할 필요가 있습니다.

---

[PDF 보기](https://arxiv.org/pdf/2604.25711)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).