Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

C2RUST-BENCH: A Minimized, Representative Dataset for C-to-Rust Transpilation Evaluation

Created by
  • Haebom

저자

Melih Sirlanci, Carter Yagemann, Zhiqiang Lin

개요

본 논문은 지난 20년간 취약점 탐지 노력에도 불구하고 메모리 안전성 취약점이 여전히 심각한 문제임을 지적하며, 메모리 안전 언어로의 마이그레이션이 주요 해결책임을 제시합니다. C 프로그램의 메모리 안전성 문제 해결을 위해 C-to-Rust 변환이 주목받고 있지만, 이를 종합적으로 평가할 수 있는 데이터셋이 부족한 실정입니다. 본 연구는 대규모 데이터셋을 분석하는 데 드는 시간과 자원을 절감하기 위해, 실제 프로그램에서 대표성을 갖는 함수들을 선별하여 최소화된 데이터셋을 구축하는 방법을 제시합니다. 그 결과, 실제 프로그램 15,503개 함수 중에서 C-to-Rust 변환을 대표하는 2,905개 함수를 포함하는 C2RUST-BENCH 데이터셋을 구축하였습니다.

시사점, 한계점

시사점:
C-to-Rust 변환 평가를 위한 효율적인 데이터셋 구축 방법 제시
C2RUST-BENCH 데이터셋은 C-to-Rust 변환 연구에 중요한 기여를 할 것으로 예상
대규모 데이터셋 분석의 시간 및 자원 소모 문제 해결에 기여
한계점:
C2RUST-BENCH 데이터셋이 모든 종류의 C 코드를 완벽하게 대표하는지는 추가 검증 필요
선택된 함수의 대표성 평가에 대한 구체적인 지표 및 방법론 제시 부족
다양한 C-to-Rust 변환 프레임워크에 대한 평가 결과 제시 부족
👍