Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Deconstructing Obfuscation: A four-dimensional framework for evaluating Large Language Models assembly code deobfuscation capabilities

Created by
  • Haebom

저자

Anton Tkachenko, Dmitrij Suskevic, Benjamin Adolphi

개요

본 논문은 상용 대규모 언어 모델(LLM)을 이용한 어셈블리 코드 디옵퓨스케이션(deobfuscation)에 대한 최초의 종합적인 평가를 제시합니다. 7개의 최첨단 LLM을 네 가지 난독화 시나리오(가짜 제어 흐름, 명령어 치환, 제어 흐름 평탄화, 그리고 이들의 조합)에 대해 테스트한 결과, 모델별 성능 차이가 크게 나타났습니다. 자율적인 디옵퓨스케이션부터 완전한 실패까지 다양한 결과가 관찰되었으며, 이러한 차이를 설명하기 위해 추론 깊이, 패턴 인식, 노이즈 필터링, 컨텍스트 통합의 네 가지 차원을 기반으로 하는 이론적 프레임워크를 제안합니다. 또한, 술어 오해석, 구조적 매핑 오류, 제어 흐름 오해석, 산술 변환 오류, 상수 전파 오류 등 다섯 가지 오류 패턴을 식별하여 LLM 코드 처리의 근본적인 한계를 밝혔습니다. 가짜 제어 흐름(저항력 낮음), 제어 흐름 평탄화(저항력 중간), 명령어 치환/조합 기법(저항력 높음)의 세 가지 저항 모델을 제시하였으며, 조합 기법에 대한 전반적인 실패는 정교한 난독화가 고급 LLM에도 효과적임을 보여줍니다. 결론적으로 특정 리버스 엔지니어링 작업에 대한 전문성 장벽을 낮추는 동시에 복잡한 디옵퓨스케이션에는 인간의 지도가 필요한 인간-AI 협업 패러다임을 제안합니다.

시사점, 한계점

시사점:
LLM을 이용한 어셈블리 코드 디옵퓨스케이션의 가능성과 한계를 최초로 종합적으로 평가.
LLM 성능 저하의 원인이 되는 다섯 가지 오류 패턴을 제시.
난독화 기법의 저항력 수준에 따른 세 가지 저항 모델을 제시.
인간-AI 협업을 통한 효율적인 리버스 엔지니어링 접근 방식 제안.
향후 LLM 기능 평가 및 내성 있는 난독화 기법 개발 위한 기반 마련.
한계점:
평가에 사용된 LLM 및 난독화 기법의 종류가 제한적일 수 있음.
제시된 이론적 프레임워크의 일반성 및 적용 범위가 제한적일 수 있음.
복잡한 난독화 기법에 대한 LLM의 취약성이 여전히 존재.
더욱 다양하고 정교한 난독화 기법에 대한 추가 연구 필요.
👍