본 논문은 오픈 소스 AI 에이전트 스킬 마켓플레이스에서 악의적인 스킬을 탐지하는 데 있어 기존 방법론의 한계를 지적하고, 이를 해결하기 위한 계층적 탐지 프레임워크인 SkillSieve를 제안한다. SkillSieve는 3단계 분석을 통해 효율성을 높이며, 정규 표현식, AST, 메타데이터 검사, LLM 기반 분석, 그리고 LLM 배심원제를 결합하여 악의적인 스킬을 효과적으로 탐지한다. 제안된 프레임워크는 실제 데이터셋과 다양한 우회 공격에 대해 높은 정확도를 달성하며, 저렴한 비용으로 배포 가능하다는 장점을 갖는다.