Benchmarking Zero-Shot Reasoning Approaches for Error Detection in Solidity Smart Contracts

Created by

Haebom

저자

Eduardo Sardenberg, Antonio Jose Grandson Busson, Daniel de Sousa Moraes, Julio Cesar Duarte, Sergio Colcher

💡 개요

본 논문은 블록체인 시스템의 핵심인 솔리디티 스마트 계약에서 발생하는 보안 취약점을 탐지하기 위해 최신 대규모 언어 모델(LLM)의 제로샷(zero-shot) 추론 능력을 평가합니다. 다양한 프롬프트 전략(제로샷, 제로샷 CoT, 제로샷 ToT)을 사용하여 오류 탐지 및 분류 작업에 대한 LLM의 성능을 비교 분석합니다. 그 결과, Chain-of-Thought(CoT) 및 Tree-of-Thought(ToT) 프롬프트가 오류 탐지 시 재현율을 크게 향상시키지만 정밀도는 감소시키는 경향을 보였으며, Claude 3 Opus 모델이 오류 분류 작업에서 가장 우수한 성능을 달성했습니다.

🔑 시사점 및 한계

•

제로샷 CoT 및 ToT 프롬프트는 솔리디티 스마트 계약의 취약점 탐지에서 높은 재현율을 달성하는 데 효과적입니다.

•

오류 탐지 시 재현율과 정밀도 간의 트레이드오프가 존재하며, 모델의 민감도 설정에 따라 탐지 결과에 영향을 미칩니다.

•

Claude 3 Opus와 같은 최신 LLM은 제로샷 방식으로도 오류 분류 작업에서 높은 성능을 보일 수 있습니다.

•

프롬프트 전략 및 모델 선택에 따른 성능 차이가 존재하므로, 실제 적용 시에는 구체적인 목표와 맥락에 맞는 최적의 조합을 찾는 것이 중요합니다. (향후 과제: 다양한 LLM 및 프롬프트 전략에 대한 더 광범위한 평가, 탐지된 오류의 오탐(false positive)을 줄이기 위한 방안 연구)

PDF 보기

Made with Slashpage