Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

R2Vul: Học cách suy luận về lỗ hổng phần mềm bằng phương pháp học tăng cường và chưng cất suy luận có cấu trúc

Created by
  • Haebom

Tác giả

Martin Weyssow, Chengran Yang, Junkai Chen, Ratnadira Widyasari, Ting Zhang, Huihui Huang, Huu Hung Nguyen, Yan Naing Tun, Tan Bui, Yikun Li, Ang Han Wei, Frank Liauw, Eng Lieh Ouh, Lwin Khin Shar, David Lo

Phác thảo

Bài báo này đề xuất R2Vul, một phương pháp mới để phát hiện lỗ hổng phần mềm. R2Vul kết hợp Phản hồi AI dựa trên Học tăng cường (RLAIF) và Chưng cất suy luận có cấu trúc để huấn luyện các LLM mã nhỏ nhằm phát hiện lỗ hổng và tạo ra các giải thích có ý thức về bảo mật. Không giống như các quy trình suy nghĩ và phương pháp điều chỉnh chỉ thị hiện có, R2Vul thưởng cho các giải thích có cơ sở vững chắc hơn là các giải thích hợp lý nhưng không có cơ sở thông qua RLAIF, dẫn đến các phát hiện chính xác hơn và các suy luận chất lượng cao hơn. Để hỗ trợ RLAIF, chúng tôi đã xây dựng bộ dữ liệu ưu tiên phát hiện lỗ hổng đa ngôn ngữ đầu tiên, bao gồm 18.000 mẫu chất lượng cao từ C#, JavaScript, Java, Python và C. Trên năm ngôn ngữ lập trình, chúng tôi đã so sánh hiệu suất của bốn công cụ phân tích tĩnh, tám mô hình cơ sở dựa trên LLM hiện đại và nhiều phương pháp tinh chỉnh khác nhau. Chúng tôi chứng minh rằng mô hình R2Vul 1,5 tỷ tham số vượt trội hơn mô hình giáo viên 32 tỷ tham số và các LLM thương mại hàng đầu như Claude-4-Opus. Ngoài ra, chúng tôi đã giới thiệu một bước hiệu chỉnh nhẹ để giảm tỷ lệ dương tính giả trong các phân phối dữ liệu mất cân bằng khác nhau. Cuối cùng, phân tích định tính cho thấy cả người đánh giá LLM và con người đều đánh giá các suy luận của mô hình R2Vul cao hơn so với các mô hình cơ sở dựa trên suy luận khác.

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày phương pháp phát hiện lỗ hổng mới R2Vul kết hợp RLAIF và phương pháp chưng cất suy luận cấu trúc.
ĐạT được hiệu suất vượt trội hơn các mô hình lớn ngay cả với các mô hình nhỏ.
Hỗ trợ đa ngôn ngữ và có thể áp dụng cho nhiều ngôn ngữ lập trình khác nhau.
Một bước hiệu chỉnh nhẹ được đề xuất để giảm tỷ lệ dương tính giả.
Tạo ra suy luận chất lượng cao và phát hiện lỗ hổng chính xác.
Xây dựng bộ dữ liệu ưu tiên phát hiện lỗ hổng đa ngôn ngữ đầu tiên.
Limitations:
Quy mô và tính đa dạng của tập dữ liệu đa ngôn ngữ được trình bày mở ra cơ hội cải thiện trong tương lai.
Có thể có sự thiên vị đối với một số ngôn ngữ lập trình hoặc loại lỗ hổng bảo mật nhất định.
Cần có thêm nghiên cứu về hiệu suất tổng quát trong môi trường thực tế.
Hiệu ứng của bước hiệu chỉnh có thể khác nhau tùy thuộc vào sự phân phối dữ liệu.
👍