본 논문은 블록체인 시스템의 핵심인 솔리디티 스마트 계약에서 발생하는 보안 취약점을 탐지하기 위해 최신 대규모 언어 모델(LLM)의 제로샷(zero-shot) 추론 능력을 평가합니다. 다양한 프롬프트 전략(제로샷, 제로샷 CoT, 제로샷 ToT)을 사용하여 오류 탐지 및 분류 작업에 대한 LLM의 성능을 비교 분석합니다. 그 결과, Chain-of-Thought(CoT) 및 Tree-of-Thought(ToT) 프롬프트가 오류 탐지 시 재현율을 크게 향상시키지만 정밀도는 감소시키는 경향을 보였으며, Claude 3 Opus 모델이 오류 분류 작업에서 가장 우수한 성능을 달성했습니다.