Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Repairing Regex Vulnerabilities via Localization-Guided Instructions

Created by
  • Haebom

저자

Sicheol Sung, Joonghyuk Hahn, Yo-Sub Han

개요

본 논문은 입력 유효성 검사 및 데이터 파싱과 같은 핵심 작업에 널리 사용되는 정규 표현식(regex)의 취약점인 ReDoS(정규 표현식 서비스 거부) 공격을 해결하기 위한 자동화된 수리 방법을 제시한다. 기존 방법론의 한계점, 즉 정확성은 높지만 복잡한 패턴 수리에 실패하거나, 일반화 능력은 뛰어나지만 정확성이 떨어지는 문제를 해결하기 위해, LLM(대규모 언어 모델)의 일반화 능력을 활용하면서 안정성을 확보하는 하이브리드 프레임워크, LRR(Localized Regex Repair)을 제안한다. LRR은 문제 식별과 수리 과정을 분리하여, 결정론적이고 기호적인 모듈을 통해 취약한 하위 패턴을 찾아내고, LLM을 통해 해당 부분의 의미론적으로 동일한 수정 사항을 생성한다. 이 결합된 아키텍처는 기존 규칙 기반 방식으로는 해결하기 어려운 복잡한 수리 사례를 성공적으로 해결하며, LLM 단독 방식의 의미적 오류를 방지한다.

시사점, 한계점

LLM의 일반화 능력을 활용하면서, 결정론적 모듈을 통해 정확성을 확보하는 하이브리드 방식 제안
ReDoS 취약점 자동 수리 문제 해결을 위한 검증된 방법론 제시
기존 SOTA(State-of-the-art) 대비 15.4%p 향상된 수리율 달성
구체적인 성능 향상에 대한 추가적인 정보 부족
LLM의존성으로 인한 잠재적 한계 (LLM의 성능에 따라 결과가 달라질 수 있음)
수리 과정의 복잡성 (모듈 간의 상호작용)에 대한 추가적인 설명 부족
👍