Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Deconstructing Obfuscation: A four-dimensional framework for evaluating Large Language Models assembly code deobfuscation capabilities

Created by
  • Haebom

저자

Anton Tkachenko, Dmitrij Suskevic, Benjamin Adolphi

개요

본 논문은 최첨단 상용 대규모 언어 모델(LLM) 7개를 대상으로 어셈블리 코드 난독화 해제 성능을 포괄적으로 평가한 최초의 연구입니다. 4가지 난독화 시나리오(가짜 제어 흐름, 명령어 치환, 제어 흐름 평탄화, 그리고 이들의 조합)에 대한 실험 결과, 모델별 성능 차이가 극명하게 나타났으며, 완전한 자동 난독화 해제부터 완전한 실패까지 다양한 결과를 보였습니다. 논문에서는 추론 깊이, 패턴 인식, 노이즈 필터링, 맥락 통합이라는 4가지 차원에 기반한 이론적 프레임워크를 제시하여 이러한 성능 차이를 설명하고, 5가지 오류 패턴(술어 오해석, 구조 매핑 오류, 제어 흐름 오해석, 산술 변환 오류, 상수 전파 오류)을 밝혀 LLM 코드 처리의 근본적인 한계를 드러냅니다. 또한, 가짜 제어 흐름(저항도 낮음), 제어 흐름 평탄화(저항도 중간), 명령어 치환/복합 기법(저항도 높음)으로 구성된 3단계 저항 모델을 제시하며, 복합 기법에 대한 전반적인 실패는 정교한 난독화가 고급 LLM에도 효과적임을 보여줍니다. 결론적으로 특정 리버스 엔지니어링 작업에 대한 전문 지식 장벽을 낮추는 동시에 복잡한 난독화 해제에는 인간의 개입이 필요한 인간-AI 협업 패러다임을 제시하며, 새로운 기능 평가 및 내성 있는 난독화 기법 개발의 기초를 제공합니다.

시사점, 한계점

시사점:
LLM을 활용한 어셈블리 코드 난독화 해제 가능성과 한계를 최초로 체계적으로 규명.
LLM의 코드 처리 성능 차이를 설명하는 이론적 프레임워크 제시.
LLM 기반 난독화 해제의 오류 패턴을 분석하고 분류.
난독화 기법의 저항도를 평가하는 3단계 모델 제시.
인간-AI 협업 기반 리버스 엔지니어링 접근 방식 제안.
향후 LLM 기반 난독화 해제 기술 및 내성 있는 난독화 기법 개발에 대한 기초 제공.
한계점:
평가에 사용된 LLM과 난독화 기법의 종류가 제한적일 수 있음.
제시된 이론적 프레임워크 및 오류 패턴의 일반성에 대한 추가 검증 필요.
더욱 정교하고 다양한 난독화 기법에 대한 LLM의 성능 평가 필요.
인간-AI 협업의 구체적인 방식 및 효율성에 대한 추가 연구 필요.
👍