본 논문은 오픈소스 대규모 언어 모델(LLM)을 사용하여 텍스트 데이터에서 프레임, 서사, 주제 등의 잠재적 구성 요소를 탐지하고 분류하기 위한 새로운 방법론적 프레임워크를 제시합니다. 제안된 하이브리드 접근 방식은 자동 요약과 사람의 개입 검증을 결합하여 구성 요소 식별의 정확성과 해석력을 높입니다. 반복적 샘플링과 전문가의 개선을 활용하여 방법론적 강건성을 보장하고 개념적 정밀도를 확보합니다. AI 정책 논쟁, 암호화에 관한 신문 기사, 20개 뉴스그룹 데이터 세트 등 다양한 데이터 세트에 적용하여 복잡한 정치 담론, 미디어 프레이밍, 주제 분류 작업을 체계적으로 분석하는 다양성을 보여줍니다.